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作为 UNIX 环 境 编 程 方面 的 经 典 著作 ， 由 著名 技术 专家 W. Richard 
Stevens $Ë Æ HJ Advanced Programming in the UNIX ® Environment EH 
1992 年 出 版 以 来 ， 受 到 专家 和 读者 的 普 裔 欢迎 。 由 Stephen A. Rago 作 
为 共同 作者 ， 根 据 新 的 系统 和 规范 进行 了 更 新 ，2005 年 出 版 了 第 2 版 。 
2013 年 由 Rago 更 狐 到 了 第 3 版 ， 涵 盖 了 70 多 个 最 新 版 POSIX.1 标 准 的 新 
增 接口 ， 删 除了 STREAMS 相 天 接口 的 内 容 ， 并 将 使 用 的 典型 平台 更 
3817JSolaris 10 ` Darwin 10.8.0 ` FressBSD 8.0 和 Ubuntu 12.04 ° 
目前 UNIX 版 本 不 断 涌 现 ， 例 如 广 为 使 用 的 苹果 Mac OS X 和 iOS 使 
用 开源 类 UNIX 操 作 系 统 Darwin， 人 谷歌 的 Android 采 用 Linux 作 为 操作 系 
统 内 核 。 尽 管 UNIX 编 程 环境 和 C 程 序 设计 语言 的 标准 化 方面 已 经 有 不 
少 工作 ， 但 系统 接口 不 断 增 加 ， 例 如 Single UNIX Specification% 15 
(SUSv1) 1994 年 出 版 时 大 约 包 含 了 1170 个 接口 〈 也 被 称 为 Spec 
1170) ， 到 2010 年 发 布 第 4 版 时 (SUSv4) ， 已 经 包括 1833 个 接口 。 虽 
然 系统 调用 接口 和 库 函 数 可 参见 《UNIX 程 序 员 手册 》 第 2、3 部 分 ,但 
“手册 中 没有 给 出 实例 及 基本 原理 ， 而 这 些 正 是 本 书 所 要 讲述 的 内 容 ” 
〈 第 1 版 前 言 ) 。 本 书 精 选 了 常用 的 400 多 个 系统 调用 和 库 函 数 ， 这 些 
接口 基本 是 UNIX 系 统 软件 的 核心 功能 ， 渔 着 了 UNIX/Linux 系统 编程 
的 方方面面 。 本 书 通过 简明 完整 的 例子 来 说 明 其 用 途 ， 不 仅仅 说 明了 
其 基本 用 法 ， 还 反映 了 不 同 平 台 之 间 细 微 差 异 ， 有 助 于 读者 对 整个 编 
程 环 境 有 全 面 深 入 的 了 解 。 在 翻译 本 书 的 过 程 中 ， 译 者 也 是 收益 民 
多 ， 同 时 ， 一 些 经 典 的 案例 已 经 用 于 大 学 课 党 教学 和 编程 实践 中 。 


本 书 的 第 2 FEES 12 章 由 同济 大 学 张 亚 英 翻译 和 校对 ， 其 余 由 上 
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元 教授 对 全 书 统 稿 。 本 书 第 1 版 和 第 2 版 中 译本 目 出 版 以 来 ， 很 多 读者 
对 其 提出 了 宝贵 意见 ， 在 本 版 本 中 尽量 采纳 了 这 些 意见 。 同 时 ， 我 们 
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我 差不多 每 次 在 接受 专访 当中 ， 或 是 做 技术 讲座 后 的 提问 时 间 
里 ， 总 会 被 问 及 这 样 一 个 问题 : “你 想到 过 UNIX 会 生存 这 么 长 时 间 
吗 ? ”上 自然， 每 次 的 回答 都 是 :“ 没 有， 我 们 没 想到 会 是 这 样 。” 从 某 种 
角度 说 ，UNIX 系统 已 经 伴随 了 商用 计算 行业 历史 的 大 半 ， 而 这 也 早 
就 不 是 什么 新 闻 了 。 

发 展 的 历程 错综复杂 ， 充 满 变数 。 目 20 世 纪 70 年 代 初 以 来 ， 计 算 
机 技术 经 历 了 沧海 桑田 般 的 变化 ， 尤 其 体现 在 网 络 技术 的 普遍 应 用 、 
图 形 化 的 无 所 不 在 、 个 人 计算 的 触手 可 及 ， 然 而 UNIX 系 统 却 奇 迹 般 地 
容纳 和 适应 了 所 有 这 些 变 化 。 虽 然 商 业 应 用 环境 在 蝎 面 领域 目前 仍然 
为 微软 和 英特尔 两 家 公司 所 统治 ， 但 是 在 某 些 方面 已 经 从 单一 供应 商 
向 多 种 来 源 转 变 ， 特 别 是 近年 来 对 公共 标准 和 免费 可 用 来 源 的 信赖 与 
日 俱 增 。 

UNIX 作为 一 种 现象 而 不 单 是 商标 品牌 ， 有 笠 能 与 时 俱 进 ， 疙 至 
领导 潮流 。 在 20 世纪 70 一 80 年 代 ，ATI&T 虽 对 UNIX 的 实际 产 代 人 码 进 
行 了 版 权 保护 ， 但 却 鼓 励 在 系统 的 接口 和 语言 基础 上 进行 标准 化 的 工 
作 。 例 如 ，AT&T 发 布 了 SVID (System V Interface Definition ， 系 统 V 
接口 定义 ) ， 这 成 为 POSIX 及 其 后 续 工 作 的 基础 。 后 来 ，UNIX 可 以 说 
相当 优雅 地 适应 了 网 络 环境 ， 虽 不 那么 轻巧 却 也 充分 地 适应 了 图 形 环 
境 。 再 往 后 ， 开 源 运 动 的 技术 基础 中 集成 了 UNIX 的 基本 内 核 接 口 和 许 
多 它 独特 的 用 户 级 工具 。 


BI E EUNIXER FAAS Be SA, XII  RUNIX AZ 
Ji BE SCAN BS EB BY, Ft xe Maurice Bach 的 
4《UNIX 操 作 系 统 设计 》 一 书 。 其 实 我 要 说 明 的 是 ，UNIX 长 寿 的 主要 
原因 是 ， 它 吸引 了 极 具 天 分 的 技术 作者 ， 为 大 众 解读 它 的 优美 和 神秘 
所 在 。Brian Kernighan 是 其 中 之 一 ，Rich Stevens 目 然 也 是 。 本 书 第 1 版 
连同 Stevens 所 和沙 的 系列 网 络 技术 书籍 ， 被 公认 为 优秀 的 、 匠 心 独 具 的 
名 著 ， 成 为 极其 畅销 的 作品 。 

然而 ， 本 书 第 1 版 毕竟 出 版 时 间 太 早 了 ， 那 时 还 没有 出 现 Linux， 
源 自 伯克利 CSRG 的 UNIX 接 口 的 开源 版 本 还 没有 广 为 流 行 ， 很 多 人 的 
网 络 还 在 用 串 行 调制 解 调 器 。Steve Rago 认 真 仔细 地 更 新 了 本 书 ， 以 
反映 所 有 这 些 技术 进展 ， 同 时 还 考虑 到 各 种 ISO 标 准 和 IEEE 标 准 这 些 
年 来 的 变化 。 因 此 ， 他 的 例子 是 最 新 的 ， 也 是 最 新 测试 过 的 。 

总 之 ， 这 是 一 本 弥 足 珍贵 的 经 典 著作 的 更 新 版 。 


Dennis Ritchie 


2005 年 3 月 于 新 泽 西 州 默 里 山 市 


了 


引言 
从 我 第 一 次 修订 《UNIX 环 境 高 级 编程 》 一 书 以 来 已 经 快 有 8 年 
了 ， 期 间 发 生 了 很 多 的 变化 。 

在 出 版 第 2 版 之 前 ，Open Group 完成 了 2004 版 的 Single UNIX 
Specification, EWE T MERRIE ° 2008F, Open Group 完成 
了 新 版 的 Single UNIX Specification， 它 更 新 了 基本 定义 ， 添 加 了 新 的 接 
口 ， 并 且 去 除了 痉 用 的 接口 。 这 套 规 范 被 称 为 2008 年 版 的 POSIX.1， 
其 中 包含 第 7 版 的 基本 规范 ， 并 在 2009 年 发 行 。2010 年 ， 它 与 更 新 后 的 
curses 接 口 捆绑 ， 一 起 作为 Single UNIX Specification 第 4 版 (SUSv4) 进 
fT HERI ° 

运行 在 Intel 处 理 器 上 的 Mac OS X38 fE A BEN 10.5 ^ 10.6411 10.8 
版， 被 Open Group 认证 为 UNIX 系 统 。 

苹果 公司 停止 了 PowerPC 平 台 上 Mac OS X 的 开发 。 在 10.6 发 行 版 

(Snow Leopard) 之 后 只 针对 x86 平 台 发 布 了 新 的 操作 系统 版 本 。 

Solaris 探 作 系 统 以 开源 的 形式 发 布 ， 试 图 与 FreeBSD、Linux 和 
Mac OS X 遵 循 的 开源 模式 在 声望 上 一 争 高 下 。 在 2010 年 ，Oracle 收 购 
T Sun Microsystems 之 后 OpenSolaris HJ F R W E ° ERER, 
Solaris 社 区 组 建 了 Hlumos 项 目 来 继续 基于 OpenSolaris 的 开源 开发 。 更 
多 详细 的 信息 可 以 从 http:/www.illumos.org 获 得 。 

2011 年 ，C 语 言 标准 被 更 新 ， 但 是 因为 系统 并 未 能 跟 上 其 变化 ， 
本 书 中 依然 参照 1999 版 。 


最 重要 的 是 ， 在 第 2 版 中 使 用 的 平台 已 经 过 时 了 。 本 书 这 一 版 中 涉 
及 以 下 平台 。 
(1) FreeBSD 8.0， 前 身 是 加 州 大 学 伯克利 分 校 计算 机 系统 研究 组 
发 布 的 4.4BSD 系 统 ， 运 行 在 32 位 Intel Pentium 处 理 器 上 。 
(2) Linux 3.2.0 (Ubuntu 12.04 发 布 版 ) ， 这 是 一 个 免费 的 类 
UNIX 操 作 系统 ， 运 行 在 64 位 的 Intel Core i5 处 理 器 上 。 
(3) Apple Mac OS X 10.6.8 版 (Darwin 10.8.0) ， 运 行 在 64 位 Intel 
Core2 Duo 处 理 器 上 (Darwin 36 T FreeBSD fll Mach) 。 我 选择 从 
PowerPC 平 台 转 向 Intel 平 台 ， 是 因为 最 新 版 的 Mac OS X 不 再 支持 
PowerPC 平 台 。 这 次 选择 带 来 的 缺点 是 涉及 的 处 理 器 倾斜 向 了 Intel， 而 
当 讨论 到 异 构 性 问题 时 ， 涉 及 的 处 理 器 如 果 能 在 字 节 序 和 整数 大 小 等 
方面 有 不 同 的 性 质 将 是 很 有 好 处 的 。 
(4) Solaris 10, Sun Microsystems (现在 的 Oracle) 的 System V 
Release 4 的 派生 系统 ， 运 行 在 64 位 UltraSPARC ITi Ab IESE ° 
与 第 2 版 的 不 同 
最 大 的 变化 之 一 是 POSIX.1-2008 中 的 Single UNIX Specification 弃 用 
了 一 些 STREAMS 相 关 接 口 。 这 是 准备 在 该 标准 的 未 来 版 本 中 去 掉 全 部 
这 些 接口 过 程 的 第 一 步 。 因 此 ， 我 已 经 不 情愿 地 在 这 一 版 中 删除 了 
STREAMS 的 内 容 。 这 是 一 个 不 和 的 变化 ， 因 为 STREAMS 接 口 为 socket 
接口 提供 了 一 个 很 好 的 对 照 ， 并 且 在 很 多 方面 更 为 灵活 。 不 可 否认 ， 
当 谈论 到 STREAMS 时 我 并 非 绝 对 公正 ， 但 是 这 无 疑问 的 是 ， 在 现 有 系 
统 中 它 的 分 量 已 经 减轻 。 
Linux 基 础 系统 中 未 包含 STREAMS ， 虽 然 添 加 该 功能 的 包 (LIS 
和 OpenSS7) 是 可 用 的 。 
B Solaris 10 中 包含 了 STREAMS， 但 是 Solaris 11 的 socket 实 现 并 
没有 构建 在 STREAMS 之 上 。 
Mac OS X 不 包含 STREAMS 文 持 。 


FreeBSD 不 包含 STREAMS 支 持 (也 从 未 包含 过 ) 。 

随 着 STREAMS 相 关内 容 的 去 除 ， 新 的 主题 变 得 有 机 会 替代 它 ， 例 
如 POSIX 异 步 /O。 

在 本 书 第 2 版 中 ，Linux 版 本 是 基于 2.4 版 的 。 在 这 次 的 版 本 中 ， 我 
们 已 经 更 新 到 了 3.2 版 。 两 个 版 本 的 最 大 不 同 之 一 是 线程 系统 。 在 
Linux 2.4 和 Linux 2.6 之 间 ， 线 程 的 实现 变 为 Native POSIX Thread 
Library (NPTL) 。NPTL 使 得 Linux 线 程 的 行为 与 其 他 系统 的 线程 更 加 
相似 。 

尽 的 来 说 ， 这 次 的 版 本 涵盖 了 超过 70 个 新 的 接口 ， 包 括 处 理 异步 
1O、 自 旋 锁 、 屏 障 和 POSIX 信 号 量 等 接口 。 除 了 一 些 普 遍 使 用 的 接口 
税 保 留 ， 大 多 数 弃 用 的 接口 均 被 删除 。 

致谢 

许多 读者 为 第 2 版 寄 来 了 评论 和 错误 报告 。 我 很 感谢 他 们 提高 了 第 
2 版 的 准确 性 。 下 面 提 及 的 各 位 是 最 早 提出 建议 或 者 指出 错误 的 : Seth 
Arnold ^ Luke Bakken ^ Rick Ballard ^ Johannes Bittner ^ David 
Bronder ^ Vlad Buslov ^ Peter Butler ^ Yuching Chen ^ Mike Cheng ^ Jim 


Collins ` Bob Cousins ` Will Dennis ^ Thomas Dickey ` Loic Domaigné ^ 


Igor Fuksman ^ Alex Gezerlis ^ M. Scott Gordon ` Timothy Goya ^ Tony 
Graham ^ Michael Hobgood ` Michael Kerrisk ^ Youngho Kwon ^ Richard 
Li ^ Xueke Liu ` Yun Long ` Dan McGregor ` Dylan McNamee ^ Greg 
Miller ^ Simon Morgan ^ Harry Newton ^ Jim Oldfield ^ Scott Parish ^ 
Zvezdan Petkovic ` David Reiss ^ Konstantinos Sakoutis ` David Smoot ^ 
David Somers ^ Andriy Tkachuk ^ Nathan Weeks ^ Florian Weimer ^ 
Qingyang Xu 和 Michael Zalokar ° 

技术 审 校 者 也 提高 了 内 容 的 准确 性 ， 感 谢 Steve Albert ^ Bogdan 
Barbu 和 Robert Day。 特 别 感谢 Geoff Clare 和 Andrew Josey 为 Single UNIX 


Specification 的 升华 和 第 2 章 的 准确 性 提供 了 帮助 。 另 外 ， 感 谢 Ken 
Thompson 对 历史 问题 做 出 了 解答 。 

我 得 再 一 次 说 ， 与 Addison-Wesley 的 工作 人 员 的 合作 非常 愉快 。 
感谢 Kim Boedigheimer 、 Romny French 、 John Fuller 、 Jessica 
Goldstein ` Julie Nahil 和 Debra Williams-Cauley， 此 外 ， 感 谢 身 ] Hobbs 
这 上 段 时 间 提 供 了 她 的 专业 审 稿 能 

最 后 ， 感 谢 我 的 家 人 对 我 在 这 次 再 版 上 花费 了 如 此 多 时 间 给 予 的 
理解 。 

和 以 前 一 样 ， 书 中 实例 的 源码 可 以 从 www.apuebook.com 上 和 获得， 
我 非常 欢迎 读者 发 来 邮件 ， 发 表 评 论 ， 提 出 建议 ， 订 正 错误 。 

Stephen A. Rago sar@apuebook.com 

2 013 年 1 月 于 新 汉 西 州 沃 伦 市 

第 2 版 前 言 

引言 

我 与 Rich Stevens 最 早 是 通过 电子 邮件 开始 交往 的 ， 当 时 我 发 邮件 
报告 他 的 第 一 本 书 《UNIX 网 络 编程 》 的 一 个 排版 错误 。 他 回信 开玩笑 
说 我 是 第 一 个 给 他 发 这 本 书 勤 误 的 人 。 到 他 1999 年 故去 之 前 ， 我 们 会 
时 不 时 地 通 一 些 邮 件 ， 一 般 都 是 在 有 了 问题 认为 对 方 能 解答 的 时 候 。 
我 们 在 USENIX 会 议 期 间 多 次 相 见 ， 并 共 进 晚餐 ，Rich 在 会 议 中 给 大 家 
做 技术 培训 。 

Rich Stevens 真 是 个 益友 ， 行 为 举止 很 有 绅士 风度 。 我 在 1993 年 写 

《UNIX 系 统 V 网 络 编程 》 时 ， 试 图 把 书写 成 他 的 《UNIX 网 络 编程 》 的 
系统 V 版 。Rich 高 兴 地 为 我 审阅 了 好 几 章 ， 并 不 把 我 当成 竞争 对 手 ， 而 
是 当 作 一 起 写 书 的 同事 。 我 们 曾 多 次 谈 到 要 合作 给 他 的 《TCP/IP 详 
解 》 写 个 STREAMS 版 。 天 者 有 情 ， 我 们 或 许 已 经 完成 了 这 个 心愿 。 然 
而 ，Rich 已 经 芍 稚 西 去 ， 修 订 《UNIX 环 境 高 级 编程 》 束 成 为 我 跟 他 一 
起 写 书 的 最 易 实 现 的 方式 。 


当 Addison-Wesley 公 司 的 编辑 找到 我 说 想 修订 Rich 的 这 本 书 时 ， 我 
第 一 反应 是 这 本 书 没有 多 少 要 改 的 。 尽 管 13 年 过 去 了 ，Rich 的 书 还 是 
寿 然 屹立 。 但 是 ， 与 当初 本 书 出 版 的 时 候 相 比 ， 今 日 的 UNIX 行 业已 经 
有 了 巨大 的 变化 。 

系统 V 的 各 个 变种 渐渐 被 Linux 所 取代 。 原 来 生产 硬件 配 以 各 目的 
UNIX 版 本 的 几 个 主要 广 商 ， 要 么 提供 了 Linux 的 移植 版 本 ， 要 么 宣布 
支持 Linux。Solaris 可 能 算是 人 硕果 仪 存 的 占有 一 定 市 场 份额 的 UNIX 系 统 
Vika ta T ° 

加 州 大 学 伯克利 分 校 的 CSRG (计算 机 科学 研究 组 ， 在 发 布 了 
4.4BSD 之 后 ， 已 经 决定 不 再 开发 UNIX 操 作 系统 ， 只 有 几 个 志愿 者 小 组 
还 维护 着 一 些 可 公开 获得 的 版 本 。 

Linux 得 到 数 以 千 计 的 志愿 者 的 支持 ， 它 的 引入 使 任何 一 个 拥有 
计算 机 的 人 都 能 运行 类 似 于 UNIX 系统 的 操作 系统 ， 并 且 可 以 免费 获 
得 源 代码 支持 哪怕 最 新 的 硬件 设备 。 在 已 经 存在 儿 种 免费 BSD 版 本 的 
情况 下 ，Linux 的 成 功 确 实 是 个 奇迹 。 

苹果 公司 作为 一 个 富有 创新 精神 的 公司 ， 已 经 放弃 了 老 的 Mac 
操作 系统 ， 取 而 代 之 的 是 一 个 在 Mach 和 FreeBSD 基 础 上 开发 的 新 系 
统 。 

因此 ， 我 已 经 努力 更 新 本 书 中 的 内 容 ， 以 反映 这 4 种 平台 。 

在 Rich 1992 年 出 版 了 《UNIX 环 境 高 级 编程 》 之 后 ， 我 扔 掉 了 手头 
几乎 所 有 的 UNIX 程 序 员 手册 。 这 些 年 来 ， 我 桌 上 最 常 摆 放 的 就 是 两 本 
书 ， 一 本 是 字典 ， 另 一 本 就 是 《UNIX 环境 高 级 编程 》。 我 希望 读者 也 
能 认为 本 修订 版 一 样 有 用 。 

对 第 1 版 的 改动 

Rich 的 书 依然 屹立 ， 我 试图 不 去 改动 他 这 本 书 原来 的 风格 。 但 是 
13 年 间 世 事 兴 误 ， 尤 其 是 影响 UNIX 编 程 接口 的 有 关 标 准 变 化 很 大 。 


我 依据 标准 化 组 织 的 标准 ， 更 新 了 全 书 相 天 的 接口 方面 的 内 容 。 
第 2 章 改 动 较 大 ， 因 为 它 主要 是 讨论 标准 的 。 本 书 第 1 版 是 根据 POSIX.1 
标准 的 1990 年 版 写 的 ， 本 修订 版 依据 2001 年 版 的 新 标准 ， 内 容 要 下 祖 
很 多 。1990 年 ISO 的 C 标 准 在 1999 年 也 更 新 了 ， 有 些 改动 影响 到 
POSIX.1 标 准 中 的 接口 。 

目前 的 POSIX.1 规 范 溯 盖 了 更 多 的 接口 。Open Group ( 原 称 
X/Open) 发 布 的 “Single UNIX Specification” 的 基本 规范 现在 已 经 并 入 
POSIX.1， 后 者 包含 了 几 个 1003.1 标准 和 另外 几 个 标准 草案 ， 原 来 这 
些 标 准 是 分 开 出 版 的 。 

我 也 相应 地 增加 了 些 章节 ， 讨 论 新 主题 。 线 程 和 多 线程 编程 是 相 
当 重 要 的 概念 ， 因 为 它们 为 程序 员 人 处 理 并 发 和 异步 提供 了 更 清楚 的 方 
式 o 

套 接 字 接 口 现在 也 是 POSIX.1 的 一 部 分 了 。 它 为 进程 间 通 信 

(IPC) 提供 了 单一 的 接口 ， 而 不 考虑 进程 的 位 置 。 它 成 为 IPC 章 市 的 
目 然 扩展 。 

我 省 略 了 POSIX.1 中 的 大 部 分 实时 接口 。 这 些 内 容 最 好 是 在 一 本 专 
门 讲述 实时 编程 的 书 中 介绍 。 参 考 文献 里 有 一 本 这 方面 的 书 。 

我 把 最 后 面 儿 章 的 案例 研究 也 更 新 了 ， 用 了 更 接近 现实 的 例子 。 
例如 ， 现 在 很 少 有 系统 通过 串口 或 并 口 连 接 PostScript 打印 机 了 ， 多 数 
PostScript 打印 机 是 通过 网 络 连 接 的 ， 所 以 我 对 PostScript 打 印 机 通信 的 
例子 做 了 修改 。 

有 关 调 制 解 调 器 通信 的 那 一 章 如 今 已 经 不 太 适 用 了 。 原始 材料 我 
们 保留 在 本 书 网 站 上， 有 了 两 种 格式 : PostScript 

(http://www.apuebook.com/lostchapter/modem.ps) 和 PDF (http://www. 


apuebook.com/lostchapter/modem.pdf) 。 
书 中 实例 的 源 代 码 也 可 以 从 www.apuebook.com 上 获得 。 多 数 实 例 
已 经 在 下 述 4 种 平台 上 运行 过 了 。 


(1) FreeBSD 5.2.1， 是 加 州 大 学 伯克利 分 校 CSRG 的 4.4BSD 的 一 
个 变种 ， 在 英特尔 奔腾 处 理 器 上 运行 。 
(2) Linux 2.4.22 (Mandrake 9.2/2 fH) ， 是 一 个 免费 的 类 UNIX 操 
作 系 统 ， 运 行 于 英特尔 奔腾 处 理 右 上 。 
(3) Solaris 9， 是 Sun 公 司 系 统 V 版 本 4 的 变种 ， 运 行 于 64 位 的 
UltraSPARC ITi 处 理 器 上 。 
(4) Darwin 7.4.0， 是 基于 FreeBSD 和 Mach 的 操作 系统 环境 ， 也 是 
Apple Mac OS X 10.3 版 本 的 核心 ， 运 行 于 PowerPC 处 理 器 上 。 
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感谢 David Bausum ^ David Boreham ^ Keith Bostic ^ Mark Ellis ^ Phil 
Howard ^ Andrew Josey ^ Mukesh Kacker ^ Brian Kernighan ^ Bengt 
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第 1 版 前 言 

引言 

本 书 摘 述 了 UNIX 系 统 的 程序 设计 接口 一 一 系统 调用 接口 和 标准 C 
库 提 供 的 很 多 函数 。 本 书 针对 的 是 所 有 的 程序 员 。 

与 大 多 数 操作 系统 一 样 ，UNIX 为 程序 运行 提供 了 大 量 的 服务 一 一 
打开 文件 、 读 文件 、 局 动 一 个 新 程序 、 分 配 存 储 区 以 及 获得 当前 时 间 
等 。 这 些 服务 被 称 为 系统 调用 接口 (system call interface) 。 另 外 ， 标 
准 C 库 提供 了 大 量 广泛 用 于 C 程 序 中 的 函数 (格式 化 输出 变量 的 值 、 比 
较 两 个 字符 串 等 ) 。 

系统 调用 接口 和 库 函 数 可 参见 《UNIX 程 序 员 手册 》 第 2、3 部 分 。 
本 书 不 是 这 些 内 容 的 重复 。 手 册 中 没有 给 出 实例 及 基本 原理 ， 而 这 些 
则 正 是 本 书 所 要 讲述 的 内 容 。 

UNIX 标 准 

20 世 纪 80 年 代 出 现 了 各 种 版 本 的 UNIX，20 世 纪 80 年 代 后 期 ， 人 们 
在 此 基础 上 制定 了 数 个 国际 标准 ， 包 括 C 程 序 设 计 语言 的 ANSI 标准 、 
IEEE POSIX 标准 系列 (还 在 制定 中 ) 、X/Open 可 移植 性 指南 。 

本 书 也 介绍 了 这 些 标准 ， 但 是 并 不 只 是 说 明 标 准 本 喘 ， 而 是 着 重 
说 明 它 们 与 应 用 广泛 的 一 些 实现 (主要 指 SVR4 以 及 即将 发 布 的 
4.4BSD) 之 间 的 关系 。 这 是 一 种 贴近 现实 世界 的 描述 ， 而 这 正 是 标准 
本 身 以 及 仅 描 述 标准 的 文献 所 缺少 的 。 

本 书 的 组 织 

本 书 分 为 以 下 6 个 部 分 。 

(1) 对 UNIX 程 序 设计 基本 概念 和 术语 的 简要 描述 (第 1 章 ) ， 以 
及 对 各 种 UNIX 标 准 化 工作 和 不 同 UNIX 实 现 的 讨论 (第 2 章 ) 。 


(2) WO 一 一 不 带 缓存 的 VO (5833€) 、 文 件 和 目录 (第 4 章 ) ` 
标准 MO 库 (第 5 章 ) 和 标准 系统 数据 文件 (第 6 章 ) 。 

(3) 进程 一 -UNIX 进 程 的 环境 7 章 ) 、 进 程控 制 (第 8 
X) 、 进 程 之 间 的 关系 (第 9 章 ) 和 信号 (第 10 章 ) 。 

(4) 更 多 的 WO 一 一 终端 I/O (第 11 章 ) 、 高 级 1/O (第 12 章 ) FSF 
护 进程 (第 13 章 ) 。 
(5) IPC 一 一 程 间 通 信 (第 14 章 和 第 15 章 ) 。 
(6) 实例 一 一 个 数据 库 的 函数 库 (第 16 章 ) ` PostScript 打印 机 
的 通信 (第 17 章 ) 、 调 制 解 调 器 拨号 程序 (第 18 章 ) 和 使 用 伪 终 端 
(第 19 章 ) 。 

如 果 对 C 语 言 较 熟悉 并 具有 某 些 应 用 UNIX 的 经 验 ， 对 学 习 本 书 将 
非常 有 益 ， 但 是 并 不 要 求 读 者 必须 具有 UNIX 编 程 经 验 。 本 书面 向 的 读 
者 主要 是 : 熟悉 UNIX 的 程序 员 ， 以 及 熟悉 其 他 某 个 操作 系统 且 希 望 了 
解 大 多 数 UNIX 系 统 提 供 的 各 种 服务 细节 的 程序 员 。 

本 书 中 的 实例 

本 书包 含 了 大 量 实例 一 一 大 约 10 000 行 源 代码 。 所 有 实例 都 用 
ANSI C 语 言 编 写 。 在 阅读 本 书 时 ， 建 议 准备 一 本 你 所 使 用 的 UNIX 系 统 
的 《UNIX 程 序 员 手 册 》， 在 细节 方面 有 时 需要 参考 该 手册 。 

几乎 对 于 每 一 个 函数 和 系统 调用 ， 本 书 都 用 一 个 小 的 完整 的 程序 
进行 了 演示 。 这 可 以 让 读者 清楚 地 了 解 它们 的 用 法 ， 包 括 参数 和 返回 
值 等 。 有 些小 程序 还 不 足以 说 明 库 函数 和 系统 调用 的 复杂 功能 和 应 用 
技巧 ， 所 以 书 中 还 包含 了 一 些 较 大 的 实例 〈 见 第 16 章 至 第 19 章 ) 。 

所 有 实例 的 源 代码 文件 都 可 在 因特网 上 用 匿名 ftp 从 因特网 主机 
ftp.uu.net 的 published/books/stevens. advprog.tar.Z 文 件 下 载 。 读 者 可 以 
在 自己 的 机 器 上 修改 并 运行 这 些 源 代码 。 

用 于 测试 实例 的 系统 


(第 
(第 


遗憾 的 是 ， 所 有 的 操作 系统 都 在 不 断 变 更 ，UNIX 也 不 例外 。 下 图 
给 出 了 系统 V 和 4.xBSD 最 近 的 进展 情况 。 


4.3+BSD 
4.3BSD 4.3BSD Tahoe 4.3BSD Reno 4.4BSD ? 
BSD Net 1 BSD Net 2 
Y ' ' 
1986 | 1987 | 1988 t 1989 t 1990 人 | 1991 | 1992 
| 1 | 
SVR3.0 SVR3.1 SVR3.2 | | SVR4 | 
| 1 | 
XPG3 ANSI C POSIX.1 


4.xBSD 是 由 加 州 大 学 伯克利 分 校 CSRG 开 发 的 。 该 小 组 还 发 布 了 
BSD Net1 和 BSD Net2 版 ， 其 公开 的 源 代 人 码 源 自 4.xBSD 系 统 。SVRx 表 
示 AT&T 的 系统 V 第 x 版 %。XPG3 指 X/Open 可 移植 性 指南 的 第 3 个 发 行 
版 。ANSI C 是 C 语 言 的 ANSI 标 准 。POSIX.1 是 IEEE 和 ISO 的 类 UNIX 系 
统 接口 标准 。2.2 节 和 2.3 节 将 对 这 些 标准 和 不 同 版 本 之 间 的 差别 做 更 多 
的 说 明 e 

本 书 中 用 4.3+BSD 表 示 源 自 伯 克利 的 介 于 BSD Net2 和 4.4BSD 之 间 
的 UNIX 系 统 。 

在 本 书写 作 时 ，4.4BSD 尚未 发 布 ， 所 以 还 不 能 称 之 为 4.4BSD 。 
为 了 用 一 个 简单 的 名 字 来 引用 该 系统 ， 故 使 用 4.3+BSD 。 

本 书 中 的 大 多 数 实例 曾 在 下 面 4 种 UNIX 系 统 上 运行 过 。 

(1) UH 公司 (UHC) 的 UNIX 系统 V/386 R4.0.2 (vanilla 
SVR4) ， 运 行 于 Intel 80386 处 理 器 上 。 

(2) 加 州 大 学 伯克利 分 校 CSRG 的 4.3+BSD， 运 行 于 惠普 工作 站 
ge o 

(3) 伯克利 软件 设计 公司 的 BSD/386 (是 BSD Net2 的 变种 ) , j2 
行 于 Intel 80386 处 理 器 上 。 该 系统 与 4.3+BSD 几 乎 相同 。 


(4) SunZ H]ÉJSunOS 4.1.1 和 4.1.2 (该 系统 与 伯克利 系统 有 很 深 
的 渊源 ， 但 也 包含 了 许多 系统 V 的 特性 ) ， 运 行 于 SPARCstation SLC 
ése 

本 书 还 提供 了 许多 对 系统 进行 的 时 间 测 试 ， 并 注 明 了 用 于 测试 的 
实际 系统 。 
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所 有 操作 系统 都 为 它们 所 运行 的 程序 提供 服务 。 典 型 的 服务 包 
括 : 执行 新 程序 、 打 开 文 件 、 读 文件 、 分 配 存储 区 以 及 获得 当前 时 间 
等 ， 本 书 集中 阐述 不 同 版 本 的 UNIX 操 作 系统 所 提供 的 服务 。 

想 要 按 严 格 的 先后 顺序 介绍 UNIX， 而 不 超前 引用 尚未 介绍 过 的 术 
语 ， 这 几乎 是 不 可 能 的 (可 能 也 会 令 人 厌烦 ) 。 本 章 从 程序 员 的 角度 
快速 浏览 UNIX， 对 书 中 引用 的 一 些 术 语 和 概念 进行 简要 的 说 明 并 给 出 
实例 。 在 以 后 各 章 中 ， 将 对 这 些 概念 做 更 详细 的 说 明 。 对 于 初 水 UNIX 
环境 的 程序 员 ， 本 章 还 簿 要 介绍 了 UNIX 提 供 的 各 种 服务 。 


1.2 UNIX 体 系 结 


从 严格 意义 上 说 ， 可 将 操作 系统 定义 为 一 种 软件 ， 它 控制 计算 机 
硬件 资源 ， 提 供 程序 运行 环境 。 我 们 通常 将 这 种 软件 称 为 内 核 
(kernel) ， 因 为 它 相 对 较 小 ， 而 且 位 于 环境 的 核心 。 图 1-1 显 示 了 
UNIX 系 统 的 体系 结构 。 
内 核 的 接口 被 称 为 系统 调用 (system call， 图 1-1 中 的 阴影 部 分 ) 
公用 函数 库 构 建 在 系统 调用 接口 之 上 ， 应 用 程序 既 可 使 用 公用 函数 


库 ， 也 可 使 用 系统 调用 。 (我 们 将 在 1.11 ONE 28 Se Va A AE Es BA 
多 说 明 。) shell 是 一 个 特殊 的 应 用 程序 ， 为 运行 其 他 应 用 程序 提供 了 
= 


应 用 程序 


公用 函数 库 


图 1-1 UNIX 操 作 系统 的 体系 结构 
从 广义 上 说 ,操作 系统 包括 了 内 核 和 一 些 其 他 软件 ， 这 些 软 件 使 


得 计算 机 能 够 发 挥 作用 ， 并 使 计算 机 具有 目 己 的 特性 。 这 里 所 说 的 其 
他 软件 包括 系统 实用 程序 (system utility) 、 应 用 程序 、shell 以 及 公用 
函数 库 等 。 

例如 ，Linux 是 GNU 控 作 系 统 使 用 的 内 核 。 一 些 人 将 这 种 操作 系统 
PRAGNU/Linuxf#/FAS, (hae, SOLA etal PRA Linux ° R 
然 这 种 表达 方法 在 严格 意义 上 讲 并 不 正确 ， 但 鉴于 “操作 系统 ”这 个 词 
的 双重 含义 ， 这 种 叫 法 还 是 可 以 理解 的 这样 的 叫 法 更 简洁 ) 。 


1.3 登 


1. 登录 名 

用 户 在 登录 UNIX 系 统 时 ， 移 键入 登录 名 ， 然 后 键入 口令 。 系 统 在 
其 口令 文件 (通常 是 /etc/passwd 文 件 ) 中 查看 登录 名 。 口 令 文件 中 的 登 
杂项 由 7 个 以 冒号 分 隔 的 字段 组 成 ， 依 次 是 ， RS > OS > B+ 
HID (205) 、 数 字 组 ID (105) 、 注 释 字 段 、 起 始 目 录 
(/home/sar) 以 及 shell 程 序 (/bin/ksh) 。 

sar:x:205:105:Stephen Rago:/home/sar:/bin/ksh 

目前 ， 所 有 的 系统 已 将 加 密 口 令 移 到 另 一 个 文件 中 。 第 6 章 将 说 明 
这 种 文件 以 及 访问 它们 的 函数 。 

2. shell 

用 户 登 录 后 ， 系 统 通常 先 显 示 一 些 系统 信息 ， 然 后 用 户 就 可 以 向 
shell 程序 键入 命令 。 ( 当 用 户 登 录 时 ， 某 些 系统 局 动 一 个 视窗 管理 程 
FF. 但 最 终 总 会 有 一 个 shell 程序 运行 在 一 个 视窗 中 ) 。shell 是 一 个 命 
令 行 解释 帮 ， 它 读 取 用 户 输入 ， 然 后 执行 命令 。shell 的 用 户 输 入 通常 
来 自 于 终端 (交互 式 shell) ， 有 时 则 来 自 于 文件 〈 称 为 shell 脚 本 ) ° Al 
1-2 总 结 了 UNIX 系 统 中 常见 的 shell 。 


名 称 路 径 FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 Solaris 10 


+ 1 
bash 的 副本 


Bourne shell /bin/sh . 
Bourne-again shell /bin/bash 可 选 的 


C shell /bin/csh 链接 至 tesh 可 选 的 链接 至 tcsh 
Korn shell /bin/ksh 可 选 的 可 选 的 。 


TENEX C shell /bin/tcsh 可 选 的 


图 1-2 UNIX 系 统 中 常见 的 shell 


系统 从 口令 文件 中 相应 用 户 登 录 项 的 最 后 一 个 字段 中 了 解 到 应 该 
为 该 登录 用 户 执行 哪 一 个 shell 。 


自 V7 以 来 ， 由 Steve Bourne 在 贝尔 实验 室 开 发 的 Bourne shell 得 到 了 
广泛 应 用 ， 几 乎 每 一 个 现 有 的 UNIX 系 统 都 提供 Bourne shell， 其 控制 流 
结构 类 似 于 Algol 68 ° 

C shell FH Bill Joy 在 伯克利 开发 的 ， 所 有 BSD 版 本 都 提供 这 种 
shell » 557^, AT&THJSystem V/386 R3.2 和 System V RA (SVR4) 也 提 
HEC shell. (下 一 章 将 对 这 些 不 同 版 本 的 UNIX 系 统 做 更 多 说 明 ) eC 
shell 是 在 第 6 版 shell 而 非 Bourne shell 的 基础 上 构造 的 ， 其 控制 流 类 似 于 
C 语 言 ， 它 文 持 Bourne shell 没 有 的 一 些 特 色 功 能 ， 例 如 作业 控制 、 历 史 
机 制 以 及 命令 行 编辑 等 。 

Korn shell 是 Bourne shell 的 后 继 者 ， 它 百 完 在 SVR4 中 提供 。Korn 
shell 是 由 贝尔 实验 室 的 David Kom 开 发 的 ， 在 大 多 数 UNIX 系 统 上 运 
行 ， 但 在 SVR4 之 前 ， 通 常 它 需要 另行 购买 ， 所 以 没有 其 他 两 种 shell 流 
行 。 它 与 Bourne shell 问 上 兼容 ， 并 具有 使 C shell 广 泛 得 到 应 用 的 一 些 
特色 功能 ， 包 括 作 业 控 制 以 及 命令 行 编辑 等 。 

Bourne-again shell 是 GNU shell， 所 有 Linux 系 统 都 提供 这 种 shell 。 
它 的 设计 遵循 POSIX 标 准 ， 同 时 也 保留 了 与 Bourne shell 的 兼容 性 。 它 
支持 C shell 和 Korn shell 两 者 的 特色 功能 。 

TENEX C shell 是 C shell 的 加 强 版 本 。 它 从 TENEX 操 作 系 统 (1972 
年 BBN 公 司 开发 ) 借鉴 了 很 多 特色 ， 例 如 命令 完备 。TENEX C shell 在 
C shell 基 础 上 增加 了 很 多 特性 ， 币 被 用 来 奉 换 C shell 。 

POSIX 1003.2 标 准 对 shell 进 行 了 标准 化 。 这 项 规范 基于 Korn shell 
和 Bourne shell 的 特性 。 

不 同 的 Linux 系 统 使 用 不 同 的 默认 shell。 一 些 Linux 默 认 使 用 
Bourne-again shell。 男 外 一 些 使 用 BSD 的 对 Bourne shell A) fia dash 

(Debian Almquist shell， 最 早 由 Kenneth Almquist 开 发 ， 并 在 后 来 移植 
入 Linux) 。FreeBSD 的 默认 用 户 shell 衍 生 于 Almquist shell ° Mac OS X 
的 默认 shell 是 Bourne-again shell 。 


Solaries 继 了 夭 了 BSD 和 System V 两 者 ， 它 提供 了 图 1-2 中 所 示 的 所 有 
shell。 在 因特网 上 可 以 找到 shell 的 自由 移植 版 软件 。 

本 书 将 使 用 这 种 形式 的 注释 来 描述 历史 注释 ， 并 对 不 同 的 UNIX 系 
统 的 实现 进行 比较 。 当 我 们 了 解 到 历史 绿 由 后 ， 会 更 好 地 理解 采用 某 
种 特定 实现 技术 的 原因 。 

本 书 将 使 用 很 多 交互 式 shell 实 例 来 执行 所 开发 的 程序 ， 这 些 实例 
使 用 了 Bourne shell ` Korn shell 和 Bourne-again shell 通 用 的 功能 。 


1.4 文件 和 目录 


1. 文件 系统 

UNIX 文 件 系统 是 目录 和 文件 的 一 种 层次 结构 ， 所 有 东西 的 起 点 是 
称 为 根 (roo) 的 目录 ， 这 个 目录 的 名 称 是 一 个 字符 “/”。 

目录 (directory) 是 一 个 包含 目录 项 的 文件 。 在 逻辑 上 ， 可 以 认为 
每 个 目录 项 都 包含 一 个 文件 名 ， 同 时 还 包含 说 明 该 文件 属性 的 信息 。 
文件 属性 是 指 文 件 类 型 《是 普通 文件 还 是 目录 等 ) 、 文 件 大 小 、 文 件 
所 有 者 、 文 件 权 限 (其 他 用 户 能 否 访 问 该 文件 ) 以 及 文件 最 后 的 修改 
时 间 等 。stat 和 fstat 函 数 返 回 包含 所 有 文件 属性 的 一 个 信息 结构 。 第 4 章 
将 详细 说 明文 件 的 各 种 属性 。 

目录 项 的 逻辑 视图 与 实际 存放 在 磁盘 上 的 方式 是 不 同 的 。UNIX 文 
件 系统 的 大 多 数 实现 并 不 在 目录 项 中 存放 属性 ， 这 是 因为 当 一 个 文件 
具有 多 个 硬 链 接 时 ， 很 难保 持 多 个 属性 副本 之 间 的 同步 。 这 一 点 将 在 
第 4 章 讨论 硬 链 接 时 理解 得 更 明晰 。 

2. 文件 名 

目录 中 的 各 个 名 字 称 为 文件 名 (filename) » HARE (/) 和 空 字 
符 这 两 个 字符 不 能 出 现在 文件 名 中 。 和 斜 线 用 来 分 隔 构成 路 径 名 的 各 文 


件 名 ， 空 字符 则 用 来 终止 一 个 路 径 名 。 尺 管 如 此 ， 好 的 习惯 还 是 只 使 

用 常用 印刷 字符 的 一 个 子 集 作为 文件 名 字符 (如 果 在 文件 名 中 使 用 了 

某 些 shell 的 特殊 字符 ， 则 必须 使 用 shell 的 引号 机 制 来 引用 文件 名 ， 这 

会 带 来 很 多 麻烦 ) 。 事 实 上 ， 为 了 可 移植 性 ，POSIX.1 推荐 将 文件 名 

限制 在 以 下 字符 集 之 内 : 字母 (a~z> A—Z) CAF (0—9) 、 句 点 
O 、 短 横 线 (C) 和 下 划 线 () e 

创建 新 目录 时 会 自动 创建 了 两 个 文件 名 : .〈 称 为 点 ) 和 .，( 称 为 点 
A) 。 点 指向 当前 目录 ， 点 点 指向 父 目 孙 。 在 最 高 层次 的 根 目 录 中 ， 
点 点 与 点 相同 。 

Research UNIX System 和 某 些 早期 UNIX System V 的 文件 系统 限制 
文件 名 的 最 大 长 度 为 14 个 字符 ，BSD 版 本 则 将 这 种 限制 扩展 为 255 个 字 
符 。 现 今 ， 几 乎 所 有 商业 化 的 UNIX 文 件 系 统 都 支持 超过 255 个 字符 的 
文件 名 。 

3. 路 径 名 

由 矢 线 分 隔 的 一 个 或 多 个 文件 名 组 成 的 序列 〈 也 可 以 斜 线 开 头 ) 
构成 路 径 名 (pathname) ， 以 斜 线 开 头 的 路 径 名 称 为 绝对 路 径 名 

(absolute pathname) ， 否 则 称 为 相对 路 径 名 (relative pathname) 。 相 
对 路 径 名 指向 相对 于 当前 目录 的 文件 。 文 件 系 统 根 的 名 字 (/) 是 一 个 
特殊 的 绝对 路 径 名 ， 它 不 包含 文件 名 。 

实例 

不 难 列 出 一 个 目录 中 所 有 文件 的 名 字 ， 图 1-3 是 1s(1) 命 令 的 简要 实 
F ° 


#include "apue.h" 
#include «dirent.h» 


int 


main(int argc, char *argv[]) 


{ 


DIR *dp; 
struct dirent *dirp; 
if (arge !- 2) 


err quit("usage: ls directory name"); 


if ((dp = opendir(argv[1])) == NULL) 
err sys("can't open $s", argv[1]); 

while ((dirp = readdir(dp)) != NULL) 
printf("%s\n", dirp-»d name); 


closedir (dp); 
exit(0); 


图 1-3 列 出 一 个 目录 中 的 所 有 文件 


ls(1) 这 种 表示 方法 是 UNIX 系统 的 惯用 方法 ， 用 以 引用 UNIX 系统 
手册 中 的 一 个 特定 项 。1s(1) 引 用 第 一 部 分 中 的 ls 项 。 各 部 分 通常 用 数 
F1~8 编号 ， 在 每 个 部 分 中 的 各 项 则 按 字母 顺序 排列 。 在 本 书 中 始终 
假定 你 有 自己 所 使 用 的 UNIX 系 统 的 手册 。 

早期 的 UNIX 系统 把 8 个 部 分 都 集中 在 一 本 《UNIX 程序 员 手 册 》 

(UNIX Programmer’s Manual) 中 。 随 着 页 数 的 增加 ， 现 在 的 趋势 是 把 
这 些 部 分 分 别 安排 在 不 同 的 手册 中 ， 例 如 用 户 手册 、 程 序 员 手 册 以 及 
系统 管理 员 手 册 等 。 

一 些 UNIX 系 统 用 大 写字 母 把 某 一 部 分 手册 进一步 分 成 若干 小 部 
分 ,例如 ，AT&T[1990e] 中 的 所 有 标准 WO 范 数 都 被 指明 位 于 3S 部 分 
中 ， 例 如 fopen(3S)。 男 一 些 UNIX 系 统 不 用 数字 而 是 用 字母 将 手册 分 成 
若干 部 分 ， 如 用 C 表 示 命 令 部 分 等 。 

现今 ， 大 多 数 手册 都 以 电子 文档 形式 提供 。 如 果 用 的 是 联机 手 
册 ， 则 可 用 下 面 的 命令 查看 ls 命令 手册 页 : 


man 1 ls 


ay, 

man -s1 ls 

图 1-3 只 打印 一 个 目录 中 各 个 文件 的 名 字 ， 不 显示 其 他 信息 ， 如 末 
该 源 文件 名 为 myls.c， 则 可 以 用 下 面 的 命令 对 其 进行 编译 ， 编 译 结 
是 生成 默认 名 为 a.out 的 可 执行 文件 中 。 

cc myls.c 

历史 上 ，cc(1) 是 C 编 译 器 。 在 配置 了 GNU C 编 译 系统 的 系统 中 ，C 
编译 需 是 gcc(1)。 其 中 ， cc 通常 链接 至 gcc © 

示例 输出 如 下 : 


$ /a.out /dev 


cdrom 
stderr 
stdout 
stdin 
fd 
sda4 
sda3 
sda2 
sdal 
sda 
tty2 
tty1 
console 
tty 
Zero 


null 
很 多 行 未 显示 

mem 

$ ./a.out /etc/ssl/private 

can't open /etc/ssl/private: Permission denied 

$ /a.out /dev/tty 

can't open /dev/tty: Not a directory 

本 书 将 以 以 下 方式 表示 输入 的 命令 及 其 输出 : 输入 的 字符 以 等 宽 
粗 体 表示 ， 程 序 输 出 则 以 上 面 所 示 的 等 宽 字 体 表 示 。 对 输出 的 注释 以 
中 文 宋体 表示 。 输 入 之 前 的 美元 符号 ($) 是 shell 的 提示 符 ， 本 书 总 是 
将 shell 提 示 符 表示 为 $ 。 

注意 ，myls 程 序列 出 的 目录 中 的 文件 名 不 是 以 字母 顺序 列 出 的 ， 
而 ls 命令 一 般 是 按 字 母 顺 序 打 印 目录 项 。 

在 这 个 20 行 的 程序 中 ， 有 很 多 细节 需要 考虑 。 

首先 ， 其 中 包含 了 一 个 头 文件 apue.h。 本 书 中 几乎 每 一 个 程序 都 
包 仿 此 头 文 件 。 它 包含 了 某 些 标准 系统 头 文件 ， 定 义 了 许多 和 常量 及 孙 
数 原 型 ， 这 些 都 将 用 于 本 书 的 各 个 实例 中 ， 附 录 B 列 出 了 这 一 头 文 件 。 

* 接 下 来 ， 我 们 包含 了 一 个 系统 头 文件 direnth， 以 便 使 用 opendir 和 
readdir 的 函数 原型 ， 以 及 dirent 结构 的 定义 。 在 其 他 一 些 系 统 里 ， 这 些 
定义 被 分 成 多 个 头 文件 。 

比如 ， 在 Ubuntu 12.04 中 ，/usr/include/dirent.h 声明 了 函数 原型 ， 
并 且 包 含 bits/direnth ， 后 者 定义 了 dirent 结构 (真正 存放 
在 /usr/include/x86_64-linux-gnu/bits 下) 

main 范 数 的 声明 使 用 了 ISO C 标 准 所 使 用 的 风格 (下 一 章 将 对 ISO 
C 标 准 进行 更 多 说 明 ) 。 

“程序 获取 命令 行 的 第 1 个 参数 argv[1] 作 为 要 列 出 其 各 个 目录 项 的 目 
孙 名 。 第 7 章 将 说 明 main 函 数 如 何 被 调用 ， 程 序 如 何 存 取 命 令 行 参数 和 


环境 变量 。 

“因为 各 种 不 同 UNIX 系统 目录 项 的 实际 格式 是 不 一 样 的 ， 所 以 使 
FA KAY opendir ` readdir#lclosedirXt H 3 £47 Ab o 

-opendir EX 2 5X [E] 18 [8] DIR Zi FJ B FRET, d 4E LEA BR ET XS 28 
readdir 函 数 。 我 们 并 不 关心 DIR 结构 中 包含 了 什么 。 然 后 ， 在 循环 中 
调用 readdir 来 读 每 个 目录 项 。 它 返回 一 个 指 疝 dirent 结构 的 指针 ， 而 
当 目 录 中 已 无 目录 项 可 读 时 则 返回 null 指针 。 在 dirent 结构 中 取出 的 只 
是 每 个 目录 项 的 名 字 (d name) 。 使 用 该 名 字 ， 此 后 就 可 调用 stat 芳 数 

( 见 4.2 节 ) 以 获得 该 文件 的 所 有 属性 。 

“程序 调用 了 两 个 自 编 的 函数 对 错误 进行 处 理 : err_sys 和 err_quit。 
从 上 面 的 输出 中 可 以 看 到 ，err_sys 妙 数 打印 一 条 消息 (“Permission 
denied” 或 “Not a directory") ， 说 明 遇 到 了 什么 类 型 的 错误 。 这 两 个 出 

背 处 理 函 数 在 附 孙 B 中 说 明 ，1.7 末 将 更 多 地 叙述 出 错 处 理 。 

“ 当 程 序 将 结束 时 ， 它 以 参数 0 调用 函数 exit。 画 数 exit 终 止 程 序 。 按 
惯例 ， 参 数 0 的 意思 是 正常 结束 ， 参 数值 1 一 255 则 表示 出 错 。8.5 节 将 说 
明 一 个 程序 (如 shell 或 我 们 所 编写 的 程序 如何 获 得 它 所 执行 的 另 一 
个 程序 的 exit 状 态 。 

4. 工作 目录 

每 个 进程 都 有 一 个 工作 目录 (working directory) ， 有 时 称 其 为 当 
前 工作 目录 (current working directory) 。 所 有 相对 路 径 名 都 从 工作 目 
了 永 开 始 解释 。 进 程 可 以 用 chdir 函 数 更 改 其 工作 目录 。 

例如 ， 相 对 路 径 名 docmemo/joe 指 的 是 当前 工作 目录 中 的 doc 目 录 
中 的 memo 目 录 中 的 文件 (或 目录 ) joe。 从 该 路 径 名 可 以 看 出 ，doc 和 
memo 都 应 当 是 目录 ,但 是 却 不 能 分 辨 joe 是 文件 还 是 目录 。 路 径 
名 /urs/ib/lint 是 一 个 绝对 路 径 名 ， 它 指 的 是 根 目 隶 中 的 usr 目 录 中 的 ]ib 目 
录 中 的 文件 (或 目录 ) lint? 

5. 起 始 目 录 


登录 时 ， 工 作 目 录 设 置 为 起 始 目 录 (home directory) ， 该 起 始 目 
录 从 口令 文件 (4.1.35). 中 相应 用 户 的 登录 项 中 取得 。 


1.5 输入 和 输出 


1. 文件 描述 符 

文件 描述 符 (file descriptor) 通 间 是 一 个 小 的 非 负 整数 ， 内 核 用 以 
标识 一 个 特定 进程 正在 访问 的 文件 。 当 内 核 打开 一 个 现 有 文件 或 创建 
一 个 新 文件 时 ， 它 都 返回 一 个 文件 描述 符 。 在 读 、 写 文件 时 ， 可 以 使 
用 这 个 文件 描述 符 。 

2. 标准 输入 、 标 准 输出 和 标准 错误 

按 惯例 ， 每 当 运 行 一 个 新 程序 时 ， 所 有 的 shell 都 为 其 打开 3 个 文 
件 描述 符 ， 即 标准 输入 (standard input) 、 标 准 输出 (standard 
output) 以 及 标准 错误 (standard error) 。 如 有 果 不 做 特殊 处 理 ， 例 如 整 
像 简 单 的 命令 ls， 则 这 3 个 描述 符 都 链接 向 终端 。 大 多 数 shell 都 提供 一 
种 方法 ， 使 其 中 任何 一 个 或 所 有 这 3 个 描述 符 都 能 重新 定向 到 某 个 文 
件 ， 例 如 : 

ls > file.list 

执行 ls 命令 ， 其 标准 输出 重新 定 癌 到 名 为 fie.list 的 文件 。 

3. 不 带 缓冲 的 MO 

EX ZXopen ` read ^ write ^ IseekL\ Kclosete tt T Aii EUR RIO ° 3X 
些 函 数 都 使 用 文件 描述 符 。 

实例 

如 果 愿 意 从 标准 输入 读 ， 并 同 标 准 输 出 写 ， 则 图 1-4 中 所 示 的 程序 
可 用 于 复制 任 一 UNIX 普 通 文件 。 


#include "apue.h" 


#define BUFFSIZE 4096 


int 
main (void) 
{ 
int nj 
char buf[BUFFSIZE]; 
while ((n = read(STDIN FILENO, buf, BUFFSIZE)) > 0) 
if (write (STDOUT FILENO, buf, n) !- n) 


err sys("write error"); 


EE (ns 9900) 
err sys("read error"); 


exit(0); 


图 1-4 将 标准 输入 复制 到 标准 输出 

X X fF <unistd.h> (apueh 中 包含 了 此 头 文 件 ) 及 两 个 常量 
STDIN_FILENO 和 STDOUT_FILENO 是 POSIX 标 准 的 一 部 分 (下 一 章 
将 对 此 做 更 多 的 说 明 ) 。 头 文件 <unistd.h> 包 含 了 很 多 UNIX 系 统 服务 的 
函数 原型 ， 例 如 图 1-4 程 序 中 调用 的 read 和 write ° 

两 个 常量 STDIN_FILENO 和 STDOUT_FILENO 定 义 在 <unistd.h> 头 
文件 中 ， 它 们 指定 了 标准 输入 和 标准 输出 的 文件 描述 符 。 在 POSIX 标 
准 中 ， 它 们 的 值 分 别 是 0O 和 1， 但 是 考 虚 到 可 读 性 ， 我 们 将 使 用 这 些 名 
字 来 表示 这 些 常 量 。 

3.9 节 将 详细 讨论 BUFFSIZE 常 量 ， 说 明 它 的 各 种 不 同 值 将 如 何 影响 
程序 的 效率 。 但 是 不 re. 此 程序 总 能 复制 任 一 UNIX 普 
通 文件 。 

read 函 数 返 回 读 取 的 字 节 数 ， 此 值 用 作 要 写 的 字 节 数 。 当 到 达 输 入 
文件 的 尾 端 时 ，read 返 回 0， 程 序 停止 执行 。 如 果 发 生 了 一 个 读 错误 ， 
readbk[u]|-1 ° HFS KARMA ER OR [n] - 1. © 

如 果 将 该 程序 编译 成 标准 名 称 的 aout 文 件 ， 并 以 下 列 方式 执行 


um 
— 


它 : 


/a.out > data 

那么 标准 输入 是 终端 ， 标 准 输出 则 重新 定向 至 文件 data， 标 准 错 
误 也 是 终端 。 如 有 果 此 输出 文件 并 不 存在 ， 则 shell 会 创建 它 。 该 程序 将 
用 户 键入 的 各 行 复 制 到 标准 输出 ， 键 入 文件 结束 符 (通常 是 Ctrl+D) 
时 ， 将 终止 本 次 复制 。 

若 以 下 列 方式 执行 该 程序 : 

/a.out < infile > outfile 

会 将 名 为 infile 文 件 的 内 容 复制 到 名 为 outfile 的 文件 中 。 

第 3 划 将 更 详细 地 说 明 不 带 缓冲 的 1/O 范 数 。 

4. 标准 IO 

标准 WO 函数 为 那些 不 带 缓冲 的 /0O 函 数 提供 了 一 个 带 缓 冲 的 接口 。 
使 用 标准 MO 函数 无 需 担 心 如 何 选取 最 佳 的 缓 神 区 大 小 ， 如 图 1-4 中 的 
BUFFSIZE 常 量 的 大 小 。 使 用 标准 WO 函数 还 简化 了 对 输入 行 的 处 理 

(常常 发 生 在 UNIX 的 应 用 程序 中 ) 。 例 如 ，fgets 函 数 读 取 一 个 完整 的 

行 ， 而 read 函 数 读 取 指定 字 节 数 。 在 5.4 节 中 我 们 将 了 解 到 ， 标 准 IO 画 
数 库 提 供 了 使 我 们 能 够 控制 该 库 所 使 用 的 缓冲 风格 的 函数 。 

我 们 最 熟悉 的 标准 WO 函数 是 printf。 在 调用 printf 的 程序 中 ， 总 是 包 
含 <stdio.h> (在 本 书 中 ， 该 头 文 件 包含 在 apue.h 中 ) ， 该 头 文件 包括 了 
PU ENEUVOERAESIE LR o 

实例 

图 1-5 程 序 的 功能 类 似 于 前 一 个 调用 了 read 和 write 的 程序 ，5.8 节 将 
对 此 程序 进行 更 详细 的 说 明 。 它 将 标准 输入 复制 到 标准 输出 ， 也 就 能 
复制 任 一 UNIX 普 通 文 件 。 


#include "apue.h" 


int 
main(void) 
( 


int C; 
while ((c = getc(stdin)) != EOF) 
if (putc(c, stdout) == EOF) 


err sys("output error"); 


if (ferror(stdin)) 
err sys("input error"); 


exit(0); 


图 1-5 用 标准 LO 将 标准 输入 复制 到 标准 输出 

函数 getc 一 次 读 取 一 个 字符 ， 然 后 男 数 putc 将 此 字符 写 到 标准 和 输 
出 。 读 到 输入 的 最 后 一 个 字 节 时 ，getc 返 回 常 量 EOF (该 常量 在 
<stdio.h> 中 定义 ) 。 标 准 1/O 常 量 stdin 和 stdout 也 在 头 文件 <stdio.h> 中 定 
义 ， 它 们 分 别 表示 标准 输入 和 标准 输出 。 


1.6 程序 和 进程 


1. 程序 

程序 (program) 是 一 个 存储 在 磁盘 上 某 个 目录 中 的 可 执行 文件 。 
内 核 使 用 exec 函 数 (7 个 exec 函 数 之 一 ) ， 将 程序 读 入 内 存 ， 并 执行 程 
序 。8.10 节 将 说 明 这 些 exec 函 数 。 

2. 进程 和 进程 ID 

程序 的 执行 实例 被 称 为 进程 (process) 。 本 书 的 每 一 页 几乎 都 会 
使 用 这 一 术语 。 某 些 操作 系统 用 任务 (task) 表示 正在 被 执行 的 程序 。 

UNIX 系 统 确保 每 个 进程 都 有 一 个 唯一 的 数字 标识 符 ， 称 为 进程 ID 
(process ID) 。 进 程 ID 总 是 一 个 非 负 整数 。 


实例 
图 1-6 程 序 用 于 打印 进程 ID © 


#include "apue.h" 


int 

main (void) 

{ 
printf("hello world from process ID %ld\n", (long) getpid()); 
exit (0); 

} 


图 1-6 打印 进程 ID 


如 果 将 该 程序 编译 成 a.out 文 件 ， 然 后 执行 它 ， 则 有 : 


$ ./a.out 


hello world from process ID 851 

$ ./a.out 

hello world from process ID 854 

此 程序 运行 时 ， 它 调用 函数 getpid 得 到 其 进程 ID。 我 们 将 会 在 后 
面 看 到 ，getpid 退回 一 个 pid_t 数 据 类 型 。 我 们 不 知道 它 的 大 小 ， 仅 知道 
的 是 标准 会 保证 它 能 保存 在 一 个 长 整 型 中 。 因 为 我 们 必须 在 printf 芳 数 
中 指定 需要 打印 的 每 一 个 变量 的 大 小 ， 所 以 我 们 必须 把 它 的 值 强制 转 
换 为 它 可 能 会 用 到 的 最 大 的 数据 类 型 《这 里 是 长 整 型 ) 。 虽 然 大 多 数 
进程 了 可 以 用 整 型 表示 ， 但 用 长 整 型 可 以 提高 可 移植 性 。 

3. 进程 控制 

有 3 个 用 于 进程 控制 的 主要 函数 : fork、exec 和 waitpid。 (exec Zi 
有 7 种 变 体 ， 但 经 常 把 它们 统称 为 exec 函 数 。) 

实例 

UNIX 系 统 的 进程 控制 功能 可 以 用 一 个 简单 的 程序 说 明 〈 见 图 1- 
7) 。 该 程序 从 标准 输入 读 取 命 令 ， 然 后 执行 这 些 命令 。 它 类 似 于 shell 
程序 的 基本 实施 部 分 。 


#include "apue.h" 
#include <sys/wait.h> 


int 
main (void) 


{ 


char buf [MAXLINE] ; /* from apue.h */ 
pid t pid; 
int status; 
printf("£$ "); /* print prompt (printf requires $$ to print $) */ 
while (fgets(buf, MAXLINE, stdin) !- NULL) { 
if (buf[strlen(buf) = 1] == '\n") 
buf[strlen(buf) - 1] = 0; /* replace newline with null */ 
if ((pid = fork()) < 0) { 
err sys("fork error"); 
} else if (pid == O) { /* child */ 


execlp(buf, buf, (char *)0); 
err ret("couldn't execute: %s", buf); 
exit(127); 

} 


/* parent */ 
if ((pid = waitpid(pid, &status, 0)) < 0) 
err sys("waitpid error"); 
prance ("SS") ¢ 
} 
exit (0); 


图 1-7 从 标准 输入 读 命令 并 执行 
在 这 个 30 行 的 程序 中 ， 有 很 多 功能 需要 考虑 。 

"用 标准 VO 函数 fgets 从 标准 输入 一 次 读 取 一 行 。 当 键入 文件 结束 符 
(通常 是 Ctrl+D) 作为 行 的 第 一 个 字符 时 ，fgets 返回 一 个 null 指针 ， 
于 是 循环 停止 ， 进 程 也 就 终止 。 第 18 章 将 说 明 所 有 特殊 的 终端 字符 

(文件 结束 、 退 格 字符 、 整 行 控 除 等 ) ， 以 及 如 何 改变 它们 。 
"因为 fgets 返 回 的 每 一 行 都 以 换行 从 终止 ， 后 随 一 个 null 字 广 ， 因 此 
用 标准 C 函 数 strlen 计 算 此 字符 串 的 长 度 ， 然 后 用 一 个 null 字 市 替换 换行 
件 。 这 样 做 是 因为 execlp 函 数 要 来 的 参数 古 以 null 结 束 的 而 不 是 以 换行 
从 结束 的 。 


“调用 fork 创 建 一 个 新 进程 。 新 进程 是 调用 进程 的 一 个 副本 ， 我 们 
称 调用 进程 为 父 进 程 ， 新 创建 的 进程 为 子 进 程 。fork 对 父 进程 返回 新 的 
子 进程 的 进程 ID (一 个 非 负 整数 ) ， 对 子 进程 则 返回 0。 因 为 fork 创建 
一 个 新 进程 ， 所 以 说 它 被 调用 一 次 〈 由 父 进程 ) ， 但 返回 两 次 (分 别 
在 父 进程 中 和 在 子 进程 中 ) o 

“在 子 进程 中 ， 调 用 execlp 以 执行 从 标准 输入 读 入 的 命令 。 这 就 用 
新 的 程序 文件 替换 了 子 进程 原先 执行 的 程序 文件 。fork 和 跟随 其 后 的 
exec 两 者 的 组 合 就 是 某 些 操作 系统 所 称 的 产生 (spawn) 一 个 新 进程 。 
在 UNIX 系 统 中 ， 这 两 部 分 分 离 成 两 个 独立 的 函数 。 第 8 章 将 对 这 些 函 
数 进行 更 多 说 明 。 

“ 子 进程 调用 execlp 执行 新 程序 文件 ， 而 父 进程 希望 等 待 子 进程 终 
止 ， 这 是 通过 调用 waitpid 实 现 的 ， 其 参数 指定 要 等 待 的 进程 ( 即 pid 参 
数 是 子 进 程 ID) 。waitpid 函 数 返 回 子 进 程 的 终止 状态 (status 变量 ) ° 
在 我 们 这 个 简单 的 程序 中 ， 没 有 使 用 该 值 。 

如 果 需 要 ， 可 以 用 此 值 准 确 地 判定 子 进程 是 如 何 终止 的 。 

"该 程序 的 最 主要 限制 是 不 能 向 所 执行 的 命令 传递 参数 。 例 如 不 能 
指定 要 列 出 目录 项 的 目录 名 ， 只 能 对 工作 目录 执行 ls 命令 。 为 了 传递 参 
数 ， 先 要 分 析 输 入 行 ， 然 后 用 某 种 约定 把 参数 分 开 (可 能 使 用 空格 或 
制 表 符 ) ， 再 将 分 隅 后 的 各 个 参数 传递 给 execlp 函 数 。 尽 管 如 此 ， 此 程 
序 仍 可 用 来 说 明 UNIX 系 统 的 进程 控制 功能 。 

如 有 果 运 行 此 程序 ， 将 得 到 下 列 结果 。 注 意 ， 该 程序 使 用 了 一 个 不 
同 的 提示 符 (96) ， 以 区 别 于 shell 的 提示 符 。 

$ ./a.out 

% date 

Sat Jan 21 19:42:07 EST 2012 

% who 


sar console Jan1 14:59 


Sar ttysOOO Jani 14:59 

Sar ttys001 Jan 15 15:28 

96 ^D 键入 文件 结束 符 

$ 常规 的 shell 提 示 符 

% pwd 

/home/sar/bk/apue/3e 

% ls 

Makefile 

a.out 

shell1.c 

AD 表示 一 个 控制 字符 。 控 制 字符 是 特殊 字符 ， 其 构成 方法 是 : 在 
键 弄 上 按 下 控制 键 一 通 锅 被 标记 为 Control 或 Ctrl， 同 时 按 另 一 个 键 。 
Ctrl+D 或 AD 是 默认 的 文件 结束 符 。 在 第 18 章 中 讨论 终端 O 时 ， 会 介绍 
更 多 的 控制 字符 。 

4. 线程 和 线程 ID 

通常 ， 一 个 进程 只 有 一 个 控制 线程 (thread) 一 某 一 时 刻 执行 的 一 
组 机 妖 指 令 。 对 于 某 些 问题 ， 如 果 有 多 个 控制 线程 分 别 作用 于 它 的 不 
同 部 分 ， 那 么 解决 起 来 就 容易 得 多 。 男 外 ， 多 个 控制 线程 也 可 以 充分 
利用 多 处 理 句 系统 的 并 行 能 

一 个 进程 内 的 所 有 线程 共享 同一 地 址 空间 、 文 件 描 述 符 、 栈 以 及 
与 进程 相关 的 属性 。 因 为 它们 能 访问 同一 存储 区 ， 所 以 各 线程 在 访问 
共享 数据 时 需要 采取 同步 措施 以 避免 不 一 致 性 。 

与 进程 相同 ， 线 程 也 用 ID 标识 。 但 是 ， 线 程 ID 只 在 它 所 属 的 进程 
内 起 作用 。 一 个 进程 中 的 线程 ID 在 男 一 个 进程 中 没有 意义 。 当 在 一 进 
程 中 对 某 个 特定 线程 进行 处 理 时 ， 我 们 可 以 使 用 该 线程 的 ID 引 用 它 。 

控制 线程 的 函数 与 控制 进程 的 钞 数 类 似 ， 但 男 有 一 套 。 线 程 模型 
是 在 进程 模型 建立 很 久之 后 才 被 引入 到 UNIX 系 统 中 的 ， 然 而 这 两 种 模 


型 之 间 存 在 复杂 的 交互 ， 在 第 12 章 中 ， 我 们 会 对 此 进行 说 明 。 


1.7 出 错 处 理 


当 UNIX 系 统 钞 数 出 错时 ， 通 常会 返回 一 个 负 值 ， 而 且 整 型 变量 
errmno 通 党 被 设置 为 具有 特定 信息 的 值 。 例 如 ，open 函数 如 条 成功 执行 
则 返回 一 个 非 负 文件 描述 符 ， 如 出 错 则 返回 -1。 在 open 出 错时 ， 有 大 
约 15 种 不 同 的 ermo 值 \ 文 件 不 存在 、 权 限 问 题 等 ) 。 而 有 些 函 数 对 于 
出 钳 则 使 用 另 一 种 约定 而 不 是 返回 负 值 。 例 如 ， 大 多 数 返 回 指向 对 象 
和 针 的 函数 ， 在 出 错时 会 返回 一 个 null 指 针 。 

文件 <errno.h> 中 定义 了 ermo 以 及 可 以 赋 与 它 的 各 种 和 常量。 这些 常 
量 都 以 字符 E 开 头 。 另 外 ，UNIX 系 统 手 册 第 2 部 分 的 第 1 页 ，intro(2) 列 
出 了 所 有 这 些 出 错 常量 。 例 如 ， 者 ermo 等 于 遂 量 EACCES， 表 示 产 生 
了 权限 问题 〈《 例 如， 没有 足够 的 权限 打开 请 求 文件 ) 。 

在 Linux 中 ， 出 错 和 常量 在 ermo(3) 手 册页 中 列 出 。 

POSIX 和 ISO C 将 ermo 定 义 为 一 个 符号 ， 它 扩展 成 为 一 个 可 修改 的 
整形 左 值 (value) 。 它 可 以 是 一 个 包含 出 错 编号 的 整数 ， 也 可 以 是 一 
个 返回 出 错 编 号 指针 的 函数 。 以 前 使 用 的 定义 是 : 

extern int errno; 

但 是 在 文 持 线程 的 环境 中 ， 多 个 线程 共享 进程 地 址 空间 ， 每 个 线 
程 都 有 属于 它 目 己 的 局 部 ermo 以 避免 一 个 线程 干扰 另 一 个 线程 。 例 
如 ，Linux 文 持 多 线程 存 取 errmno， 将 其 定义 为 : 


extern int * errno location(void); 


"define errno (* errno location()) 
对 于 errno 应 当 注 意 两 条 规则 。 第 一 条 规则 是 : WRA H, E 
值 不 会 被 例 程 清除 。 因 此 ， 仪 当 函 数 的 返回 值 指 明 出 错时 ， 才 检验 其 


fü ° 条 规则 是 : 任何 函数 都 不 会 将 erno fix BAO, MA 
<errno.h> 中 定义 的 所 有 党 量 都 不 为 0。 
C 标 准 定义 了 两 个 函数 ， 它 们 用 于 打印 出 错 信 息 。 


#include <string.h> 


char *strerror(int errnum); 
REME: 指 同 消 妃 字符 串 的 指针 
strerror 函 数 将 errnum (通常 就 是 ermo 值 ) 映射 为 一 个 出 错 消息 字 
符 串 ， 并 且 返 回 此 字符 串 的 指针 。 
perror 函 数 基 于 ermo 的 当前 值 ， 在 标准 错误 上 产生 一 条 出 销 消 息 ， 
然后 返回 。 


include <stdio.h> 


void perror(const char *msg); 

它 首 移 输出 由 msg 指 同 的 字符 串 ， 然 后 是 一 个 冒号 ， 一 个 空格 ， 接 
着 是 对 应 于 errno 值 的 出 错 消 息 ， 最 后 是 一 个 换行 符 。 

实例 

图 1-8 程 序 显 示 了 这 两 个 出 错 函 数 的 使 用 方法 。 


#include "apue.h" 
#include <errno.h> 


int 
main(int argc, char *argv[]) 
{ 
fprintf(stderr, "EACCES: %s\n", strerror(EACCES) ); 
errno = ENOENT; 
perror (argv[0]); 
exit(0); 


图 1-8 例 示 strerror 和 perror 


如 果 将 此 程序 编译 成 文件 aout， 然 后 执行 它 ， 则 有 
$ ./a.out 
EACCES: Permission denied 


/a.out: No such file or directory 

注意 ， 我 们 将 程序 名 (argv[0]， 其 值 是 .ja.out) 作为 参数 传递 给 
perror。 这 是 一 个 标准 的 UNIX 惯 例 。 使 用 这 种 方法 ， 在 程序 作为 管道 
的 一 部 分 执行 时 ， 例 如 : 

prog1 < inputfile | prog2 | prog3 > outputfile 

我 们 就 能 分 清 3 个 程序 中 的 哪 一 个 产生 了 一 条 特定 的 出 错 消息 。 

本 书 中 的 所 有 实例 基本 上 都 不 直接 调用 strerror 或 perror， 而 是 使 用 
附录 B 中 的 出 错 函 数 。 该 附录 中 的 出 错 函 数 使 我 们 只 用 一 条 C 语 句 束 可 
利用 ISO C 的 可 变 参 数 表 功能 处 理 出 错 情 况 。 

HERE 

可 将 在 <ermo.h> 中 定义 的 各 种 出 错 分 成 两 类 : 致命 性 的 和 非 致 命 
性 的 。 对 于 致命 性 的 错误 ， 无 法 执行 恢复 动作 。 最 多 能 做 的 是 在 用 户 
屏幕 上 打印 出 一 条 出 错 消息 或 者 将 一 条 出 错 消 息 写 入 日 志文 件 中 ， 然 
后 退出 。 对 于 非 致命 性 的 出 钳 ， 有 时 可 以 较 妥 善 地 进行 处 理 。 大 多 数 
非 致命 性 出 错 是 暂时 的 〈 如 资源 短缺 ) ， 当 系统 中 的 活动 较 少 时 ， 这 
种 出 错 很 可 能 不 会 发 生 。 

与 资源 相关 的 非 致 命 性 出 错 包 括 : EAGAIN ` ENFILE ` 
ENOBUFS ` ENOLCK、ENOSPC、EWOULDBLOCK， 有 时 ENOMEM 
也 是 非 致 命 性 出 错 。 当 EBUSY 指 明 共 享 资源 正在 使 用 时 ， 也 可 将 它 作 
为 非 致命 性 出 错 处 理 。 当 EINTR 中 断 一 个 慢 速 系统 调用 时 ， 可 将 它 作 
为 非 致 命 性 出 错 处 理 (在 10.5 节 对 此 会 进行 更 多 说 明 ) 。 

对 于 资源 相关 的 非 致命 性 出 错 的 典型 恢复 操作 是 延迟 一 段 时 间 ， 
然后 重 试 。 这 种 技术 可 应 用 于 其 他 情况 。 例 如 ， 假 设 出 错 表 明 一 个 网 
络 连 接 不 再 起 作用 ， 那 么 应 用 程序 可 以 采用 这 种 方法 ， 在 短 时 间 延 迟 
后 ， 尝 试 重建 该 连接 。 一 些 应 用 使 用 指数 补偿 算法 ， 在 每 次 送 代 中 等 
待 更 长 时 间 。 


最 终 ， 由 应 用 的 开发 者 决定 在 哪些 情况 下 应 用 程序 可 以 从 出 错 中 
恢复 。 如 果 能 够 采用 一 种 合理 的 恢复 策略 ， 那 么 可 以 避免 应 用 程序 异 
党 终止 ， 进 而 就 能 改善 应 用 程序 的 健壮 性 。 


1.8 用 户 标识 


1. 用 户 ID 

口令 文件 登录 项 中 的 用 户 ID (user ID) 是 一 个 数值 ， 它 向 系统 标 
识 各 个 不 同 的 用 户 。 系 统管 理 员 在 确定 一 个 用 户 的 登录 名 的 同时 ， 确 
定 其 用 户 ID。 用 户 不 能 更 改 其 用 户 ID。 通 常 每 个 用 户 有 一 个 唯一 的 用 
户 ID。 下 面 将 介绍 内 核 如 何 使 用 用 户 ID 来 检验 该 用 户 是 否 有 执行 某 些 
操作 的 权限 。 

HF ID 23 0 的 用 户 为 根 用 户 (root) 或 超级 用 户 (superuser) ° 
在 口令 文件 中 ， 通 党 有 一 个 登录 项 ， 其 登录 名 为 root， 我 们 称 这 种 用 户 
的 特权 为 超级 用 户 特 权 。 我 们 将 在 第 4 章 中 看 到 ， 如 果 一 个 进程 具有 
超级 用 户 特 权 ， 则 大 多 数 文件 权限 检查 都 不 再 进行 。 某 些 操作 系统 功 
能 只 回 超 级 用 户 提供 ， 超 级 用 户 对 系统 有 目 由 的 文 配 权 。 

Mac OS X 客 户 端 版 本 交 由 用 户 使 用 时 ， 殖 用 超级 用 户 账 户 ， 服 务 
句 版 本 则 可 使 用 该 账户 。 在 Apple 的 网 站 可 以 找到 使 用 说 明 ， 它 告知 如 
何 才能 使 用 该 账户 。 参 见 http://support.apple.com/kb/HT1528 ° 

2. 组 ID 

口令 文件 登录 项 也 包括 用 户 的 组 ID (group ID) ， 它 是 一 个 数值 。 
组 ID 也 是 由 系统 管理 员 在 指定 用 户 登 录 名 时 分 配 的 。 一 般 来 说 ， 在 口 
令 文 件 中 有 多 个 登录 项 具有 相同 的 组 ID。 组 被 用 于 将 若干 用 户 集 合 到 
项 目 或 部 门 中 去 。 这 种 机 制 允许 同 组 的 各 个 成 员 之 间 共 享 资 源 (如 文 


(E) 9 4.5 节 将 介绍 可 以 通过 设置 文件 的 权限 使 组 内 所 有 成 员 都 能 访问 
该 文件 ， 而 组 外 用 户 不 能 访问 。 

组 文件 将 组 名 映射 为 数值 的 组 ID。 组 文件 通常 是 /etcgroup。 

使 用 数值 的 用 户 ID 和 数值 的 组 ID 设置 权限 是 历史 上 形成 的 。 对 于 
磁盘 上 的 每 个 文件 ， 文 件 系统 都 存储 该 文件 所 有 者 的 用 户 ID 和 组 ID © 
存储 这 两 个 值 只 需 4 个 字 节 (假定 每 个 都 以 双 字 节 的 整 型 值 存放 ) 。 如 
果 使 用 完整 ASCI 登录 名 和 组 名 ， 则 需 更 多 的 磁盘 空间 。 男 外 ， 在 检 
验 权 限期 间 ， 比 较 字 符 串 较 之 比较 整 型 数 更 消耗 时 间 。 

但 是 对 于 用 户 而 言 ， 使 用 名 字 比 使 用 数值 方便 ， 所 以 口令 文件 包 
含 了 登录 名 和 用 户 ID 之 间 的 映射 和 关系， 而 组 文件 则 包含 了 组 名 和 组 ID 
之 间 的 映射 天 系 。 例 如 ，ls -] 命 令 使 用 口令 文件 将 数值 的 用 户 ID 映 映 为 
登录 名 ， 从 而 打印 出 文件 所 有 者 的 登录 名 。 

早期 的 UNIX 系 统 使 用 16 位 整 型 数 表 示 用 户 ID 和 组 ID。 现 今 的 
UNIX 系 统 使 用 32 位 整 型 数 表 示 用 户 ID 和 组 ID。 

实例 

图 1-9 程 序 用 于 打印 用 户 ID 和 组 ID。 


printf("uid = %d, gid = $dWMn", getuid(), getgid()); 


图 1-9 打印 用 户 ID 和 组 ID 

程序 调用 getuid 和 getgid 以 返回 用 户 ID 和 组 ID。 运 行 该 程序 的 结 
如 下 : 

$ ./a.out 

uid = 205, gid = 105 

3. 附属 组 ID 


除了 在 口令 文件 中 对 一 个 登 孙 名 指定 一 个 组 ID 外 ， 大 多 数 UNIX 系 
统 版 本 还 人 允许 一 个 用 户 属 于 男 外 一 些 组 。 这 一 功能 是 从 4.2BSD 开 始 
的 ， 它 允许 一 个 用 户 属于 多 至 16 个 其 他 的 组 。 登 录 时 ， 读 文 
件 /etc/group， 寻 找 列 有 该 用 户 作 为 其 成 员 的 前 16 个 记录 项 束 可 以 得 到 
该 用 户 的 附属 组 ID (supplementary group ID) 。 在 下 一 章 将 说 明 ， 
POSIX 要 求 系统 至 少 应 文 持 8 个 附属 组 ， 实 际 上 大 多 数 系 统 至 少 文 持 16 
个 附属 组 。 


1.9 信和 号 


信号 (signal) 用 于 通知 进程 发 生 了 某 种 情况 。 例 如 ， 若 某 一 进程 
执行 除法 操作 ， 其 除数 为 0， 则 将 名 为 SIGFPE ( 浮 点 异常 的 信号 发 送 
给 该 进程 。 进 程 有 以 下 3 种 处 理 信和 号 的 方式 。 

(1) 忽略 信号 。 有 些 信号 表示 硬件 异常 ， 例 如 ， 除 以 0 或 访问 进 
程 地 址 空间 以 外 的 存储 单元 等 ， 因 为 这 些 异常 产生 的 后 采 不 确定 ， 所 
以 不 推荐 使 用 这 种 处 理 方式 。 

(2) 按 系 统 默 认 方式 处 理 。 对 于 除数 为 0， 系 统 默 认 方 式 是 终止 
该 进程 。 

(3) 提供 一 个 函数 ， 信 号 发 生 时 调用 该 函数 ， 这 被 称 为 捕捉 该 信 
号 。 通 过 提供 目 编 的 函数 ， 我 们 吏 能 知道 什么 时 候 产 生 了 信号 ， 并 按 
期 望 的 方式 处 理 它 。 

很 多 情况 都 会 产生 信号 。 终 端 键盘 上 有 两 种 产生 信和 号 的 方法 ， 分 
别称 为 中 断 键 (interrupt key， 通 常 是 Delete 键 或 Ctrl+C) 和 退出 键 
(quit key， 通 常 是 Ctrl+\) ， 它 们 被 用 于 中 断 当 前 运行 的 进程 。 另 一 种 
产生 信和 号 的 方法 是 调用 ki 函数。 在 一 个 进程 中 调用 此 函数 瓯 可 回 另 一 


个 进程 发 送 一 个 信和 号。 当然 这 样 做 也 有 些 限 制 ， 当 同一 个 进程 发 送信 
号 时 ， 我 们 必须 是 那个 进程 的 所 有 者 或 者 是 超级 用 户 。 

实例 

回忆 一 下 基本 的 shell 实 例 〈 见 图 1-7 程 序 ) 。 如 果 调 用 此 程序 ， 然 
后 按 下 中 断 键 ， 则 执行 此 程序 的 进程 终止 。 产 生 这 种 后 果 的 原因 是 : 
对 于 此 信号 (SIGINT) 的 系统 默认 动作 是 终止 进程 。 该 进程 没有 告诉 
系统 内 核 应 该 如 何 处 理 此 信号 ， 所 以 系统 按 默认 方 式 终 止 该 进程 。 

为 了 能 捕捉 到 此 信和 号， 程序 需要 调用 signal 函 数 ， 其 中 指定 了 当 产 
生 SIGINT 信 号 时 要 调用 的 函数 的 名 字 。 画 数 名 为 sig_int， 当 其 被 调用 
时 ， 只 是 打印 一 条 消息 ， 然 后 打印 一 个 新 提示 符 。 在 图 1-7 程 序 中 添加 
了 11 行 ， 构 成 了 图 1-10 程 序 (添加 的 11 行 以 行 首 的 + 号 指示 ) 。 


#include "apue.h" 
#include <sys/wait.h> 


+ static void sig int(int); /* our signal-catching function */ 
+ 
int 
main (void) 
{ 
char buf[MAXLINE]; /* from apue.h */ 
pid_t pid; 
int status; 


if (signal(SIGINT, sig int) == SIG ERR) 
err sys("signal error"); 
+ 
printf ("%% "); /* print prompt (printf requires $$ to print %) */ 
while (fgets(buf, MAXLINE, stdin) != NULL) { 
if (buf[strlen(buf) = 1] == '\n') 
buf[strlen(buf) - 1] = 0; /* replace newline with null */ 
if ((pid = fork()) «€ 0) { 
err sys("fork error"); 
) else if (pid == 0) ( /* child */ 
execlp(buf, buf, (char *)0); 
err ret("couldn't execute: %s", buf); 
exit (127); 
} 
/* parent */ 
if ((pid = waitpid(pid, &status, 0)) < 0) 
err sys("waitpid error"); 
printf("9** "y; 
} 
exit(0); 
} 
J 
* void 
* sig int(int signo) 
NE! 
+ printf ("interrupt\n%% "); 
t} 


图 1-10 从 标准 输入 读 命令 并 执行 
为 大 多 数 重要 的 应 用 程序 都 对 信号 进行 处 理 ， 所 以 第 10 章 将 详 


1.10 AY [B] f 


历史 上 ，UNIX 系 统 使 用 过 两 种 不 同 的 时 间 值 。 

(1) 日 历时 间 。 该 值 是 自 协调 世界 时 (Coordinated Universal 
Time, UTC) 1970 年 1 月 1 日 00:00:00 这 个 特定 时 间 以 来 所 经 过 的 秒 数 累 
计 值 (早期 的 手册 称 UTC 为 格林 尼 治 标准 时 间 ) 。 这 些 时 间 值 可 用 于 
记录 文件 最 近 一 次 的 修改 时 间 等 。 

系统 基本 数据 类 型 time_t 用 于 保存 这 种 时 间 值 。 

(2) 进程 时 间 。 也 被 称 为 CPU 时 间 ， 用 以 度量 进程 使 用 的 中 央 处 
理 需 资源 。 进 程 时 间 以 时 钟 滴答 计算 。 每 秒 钟 曾 经 取 为 50、60 或 100 个 
时 钟 滴答 。 

系统 基本 数据 类 型 clock t 保 存 这 种 时 间 值 。2.5.4 节 将 说 明 如 何 用 
sysconf 函 数 得 到 每 秒 的 时 钟 滴 答 数 。 

当 度 量 一 个 进程 的 执行 时 间 时 (013.95) ，UNIX 系 统 为 一 个 进程 
维护 了 3 个 进程 时 间 值 : 

“有 时钟 时 间 ]; 

Fi P CPURT fH]; 

系统 CPU 时 间 。 

时 钟 时 间 又 称 为 墙 上 时 钟 时 间 (wall clock time) ， 它 是 进程 运行 
的 时 间 总 量 ， 其 值 与 系统 中 同时 运行 的 进程 数 有 关 。 每 当 在 本 书 中 提 
到 时 钟 时 间 时 ， 都 是 在 系统 中 没有 其 他 活动 时 进行 度量 的 。 

用 户 CPU 时 间 是 执行 用 户 指 令 所 用 的 时 间 量 。 系 统 CPU 时 间 是 为 
该 进程 执行 内 核 程序 所 经 历 的 时 间 。 例 如 ， 每 当 一 个 进程 执行 一 个 系 
统 服 务 时 ， 如 read 或 write， 在 内 核 内 执行 该 服务 所 论 费 的 时 间 就 计 入 该 
进程 的 系统 CPU 时 间 。 用 户 CPU 时 间 和 系统 CPU 时 间 之 和 和 常 被 称 为 CPU 
时 间 。 


要 取得 任 一 进程 的 时 钟 时 间 、 用 户 时 间 和 系统 时 间 是 很 容易 的 一 
只 要 执行 命令 time(1)， 其 参数 是 要 度量 其 执行 时 间 的 命令 ， 例 如 : 

$ cd /usr/include 

$ time -p grep. POSIX. SOURCE */*.h > /dev/null 


real om0.81s 


user om0.11s 

sys om0.07s 

time 命 令 的 输出 格式 与 所 使 用 的 shell 有 关 ， 其 原因 是 某 些 shell 并 不 
运行 /usrbin/time， 而 是 使 用 一 个 内 置 函 数 测 量 命 令 运行 所 使 用 的 时 
间 。 

8.17 节 将 说 明 一 个 运行 进程 如 何 取 得 这 3 个 时 间 。 关 于 时 间 和 日 期 
的 一 般 说 明 见 6.10 廊 。 


所 有 的 操作 系统 都 提供 多 种 服务 的 入 口 点 ， 由 此 程序 向 内 核 请 求 
服务 。 各 种 版 本 的 UNIX 实 现 都 提供 良好 定义 、 数 量 有 限 、 直 接 进 入 内 
核 的 入 口 点 ， 这 些 入 口 点 被 称 为 系统 调用 (system call， 见 图 1-1) 
Research UNIX 系 统 第 7 版 提供 了 约 50 个 系统 调用 ，4.4BSD 提 供 了 约 110 
个 系统 调用 ， 而 SVR4 则 提供 了 约 120 个 系统 调用 。 具 体 数 字 在 不 同 操 
作 系 统 版 本 中 会 不 同 ， 新 近 的 大 多 数 系统 大 大 增加 了 支持 的 系统 调用 
的 个 数 。Linux 3.2.0 提 供 了 380 个 系统 调用 ，FreeBSD 8.0 提 供 的 系统 调 
用 超过 450 个 。 

系统 调用 接口 总 是 在 《UNIX 程 序 员 手 册 》 的 第 2 部 分 中 说 明 ， 是 
用 C 语 言 定义 的 ,与 具体 系统 如 何 调 用 一 个 系统 调用 的 实现 技术 无 关 。 


这 与 很 多 早期 的 操作 系统 不 同 ， 那 些 系 统 按 传统 方式 用 机 器 的 汇编 语 
言 定 义 内 核 和 人口 点 。 

UNIX 所 使 用 的 技术 是 为 每 个 系统 调用 在 标准 C 库 中 设置 一 个 具有 
同样 名 字 的 函数 。 用 户 进 程 用 标准 C 调 用 序列 来 调用 这 些 函 数 ， 然 后 ， 
函数 又 用 系统 所 要 求 的 技术 调用 相应 的 内 核 服务 。 例 如 ， 画 效 可 将 一 
个 或 多 个 C 参 数 送 入 通用 寄存 部， 然后 执行 荣 个 产生 软 中 断 进入 内 核 的 
机 器 指令 。 从 应 用 角度 考虑 ， 可 将 系统 调用 祝 为 C 函 数 。 

《UNIX 程 序 员 手册 》 的 第 3 部 分 定义 了 程序 员 可 以 使 用 的 通用 库 
函 效 。 虽 然 这 些 函 数 可 能 会 调用 一 个 或 多 个 内 核 的 系统 调用 ， 但 是 它 
们 并 不 是 内 核 的 入 口 点 。 AW, printf 函数 会 调用 write 系统 调用 以 输出 
一 个 字符 串 ， 但 函数 strcpy (复制 一 个 字符 串 ) 和 atoi (将 ASCII 转 换 为 
整数 ) 并 不 使 用 任何 内 核 的 系统 调用 。 

从 实现 者 的 角度 来 看 ， 系 统 调 用 和 库 函 数 之 间 有 根本 的 区 别 ， 但 
从 用 户 角 度 来 看 ， 其 区 别 并 不 重要 。 在 本 书 中 ， 系 统 调用 和 库 函 数 都 
以 C 画 数 的 形式 出 现 ， 两 者 都 为 应 用 程序 提供 服务 。 但 是 ， 我 们 应 当 理 
解 ， 如 有 条 硕 望 的 话 ， 我 们 可 以 蔡 换 库 函 数 ， 但 是 系统 调用 通 芝 是 不 能 
EE FRH ° 
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配 及 与 其 相关 的 无 用 空间 回收 操作 〈 最 佳 适应 、 首 次 适应 等 ) ， 并 不 
存在 对 所 有 程序 都 最 优 的 一 种 技术 。UNIX 系 统 调用 中 处 理 存储 空间 分 
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JJ X ge zb ETE Ht Sk As IH] © hup PRIZE 8 READ SGACT UR ^ FF AAS 
间 分 配 函 效 malloc(3) 实 现 一 种 等 定 类 型 的 分 配 。 如 采 我 们 不 喜欢 其 操 
作 方 式 ， 则 可 以 定义 自己 的 malloc 函 数 ， 它 很 可 能 将 使 用 sbrk 系统 调 
用 。 事 实 上 ， 有 很 多 软件 包 ， 它 们 使 用 sbrk 系统 调用 实现 目 己 的 存储 
空间 分 配 算法 。 图 1-11 显 示 了 应 用 程序 、malloc 函 数 以 及 sbrk 系 统 调用 
之 间 的 关系 。 


从 中 可 见 ， 两 着 职责 不 同 ， 内 核 中 的 系统 调用 分 配 一 块 空间 给 进 
程 ， 而 库 范 数 malloc 则 在 用 户 层次 管理 这 一 空间 。 

另 一 个 可 说 明 系 统 调用 和 库 函 数 之 间 差 别 的 例子 是 ，UNIX 系统 提 
供 的 判断 当前 时 间 和 日 期 的 接口 。 一 些 操作 系统 分 别提 供 了 一 个 返回 
时 间 的 系统 调用 和 另 一 个 返回 日 期 的 系统 调用 。 任 何 特殊 的 处 理 ， 例 
如 正常 时 制 和 夏令 时 之 间 的 转换 ， 由 内 核 处 理 或 要 求人 为 干预 %。UNIX 
系统 则 不 同 ， 它 只 提供 一 个 系统 调用 ， 该 系统 调用 返回 目 协 调 世 界 时 
1970 年 1 月 1 日 零 时 这 个 特定 时 间 以 来 所 经 过 的 秒 数 。 对 该 值 的 任何 解 
释 ， 例 如 将 其 变换 成 人 们 可 读 的 、 适 用 于 本 地 时 区 的 时 间 和 日 期 ， 都 
留 给 用 户 进程 进行 处 理 。 在 标准 C 库 中 ， 提 供 了 知 干 例 程 以 处 理 大 多 数 
情况 。 这 些 库 函 数 处 理 各 种 细节 ， 如 各 种 夏令 时 算法 等 。 

应 用 程序 既 可 以 调用 系统 调用 也 可 以 调用 库 函 数 。 很 多 库 函 数 则 
会 调用 系统 调用 。 图 1-12 显 示 了 这 种 差别 。 
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图 1-12 C 库 函数 和 系统 调用 之 间 的 差别 


系统 调用 和 库 函 数 之 间 的 另 一 个 差别 是 : 系统 调用 通常 提供 一 种 
最 小 接口 ， 而 库 函 数 通 常 提 供 比较 复杂 的 功能 。 我 们 从 sbrk 系 统 调用 和 
malloc 库 函数 之 间 的 差别 中 可 以 看 到 这 一 点 。 当 我 们 比较 不 带 缓 冲 的 
IO 函数 〈 见 第 3 章 ) 和 标准 IO 函数 ( 见 第 5 章 ) 时 ， 还 将 看 到 这 种 差 


H 


Rill ° 


进程 控制 系统 调用 (fork^ exec 和 wait) 通常 由 用 户 应 用 程序 直接 
调用 (请 回忆 图 1-7 中 的 基本 shell) 。 但 是 为 了 简化 某 些 和 常见 的 情况 ， 
UNIX 系统 也 提供 了 一 些 库 函数 ， 如 system 和 popen。8.13 广 将 说 明 
system 芳 数 的 一 种 实现 ， 它 使 用 基本 的 进程 控制 系统 调用 。10.18 廊 还 
将 强化 这 一 实例 以 正确 地 人 处理 信和 号。 

为 使 读者 了 解 大 多 数 程序 员 应 用 的 UNIX 系 统 接口 ， 我 们 不 得 不 既 
说 明 系 统 调用 ， 又 介绍 某 些 库 函 数 。 例 如 ， 香 只 摘 述 sbrk 系 统 调 用 ， 那 
么 就 会 忽略 很 多 应 用 程序 使 用 的 malloc 库 函数 。 本 书 除 了 必须 要 区 分 两 
者 时 ， 对 系统 调用 和 库 函 数 都 使 用 函数 (function). 这 一 术语 来 表示 。 


1.12 小 结 


本 章 快速 浏览 JUNIX 系 统 。 说 明了 有 某 些 以 后 会 多 次 用 到 的 基本 术 
语 ， 介 绍 了 一 些小 的 UNIX 程 序 实例 。 读 者 可 以 从 中 大 概 了 解 到 本 书 其 
余部 分 将 要 介绍 的 内 容 。 

下 一 章 是 关于 UNIX 系 统 的 标准 ， 以 及 这 方面 的 工作 对 当前 系统 的 
影响 。 标 准 ， 特 别 是 ISO C 标 准 和 POSIX.1 标 准 ， 将 影响 本 书 的 余下 部 


分 。 


习题 


1.1 在 系统 上 验证 ， 除 根 目 孙 外 ， 目 孙 . 和 .. 是 不 同 的 。 
1.2 分 析 图 1-6 程 序 的 输出 ， 说 明 进 程 ID 为 852 和 853 的 进程 发 生 了 
什么 情况 ? 


1.3 ££ 1.778 F, perrorB) žit æ HISO C 的 属性 const 定 义 的 ， 而 
strerror 的 整 型 参数 没有 用 此 属性 定义 ， 为 什么 ? 

1.4 若 日 历时 间 存 放 在 带 符 号 的 32 位 整 型 数 中 ， 那 么 到 哪 一 年 它 将 
ido? 可 以 用 什么 方法 扩展 洲 出 浮 点 数 ? 采用 的 策略 是 否 与 现 有 的 应 
HRR? 

1.5 若 进 程 时 间 存 放 在 带 符号 的 32 位 整 型 数 中 ， 而 且 每 秒 为 100 时 
钟 滴答 ， 那 么 经 过 多 少 天 后 该 时 间 值 将 会 液 出 ? 


2 UNIX 标 准 及 实现 


2.1 3i Ei 


人 们 在 UNIX 编 程 环 境 和 C 程 序 设计 语言 的 标准 化 方面 已 经 做 了 很 
多 工作 。 虽 然 UNIX 应 用 程序 在 不 同 的 UNIX 操 作 系 统 版 本 之 间 进 行 移 
植 相 当 容 易 ， 但 是 20 世 纪 80 年 代 UNIX 版 本 种 类 的 剧 增 以 及 它们 之 间 差 
别 的 扩大 ， 导 致 很 多 大 用 户 (如 美国 政府 ) 呼吁 对 其 进行 标准 化 。 

本 章 首先 回顾 过 去 近 25 年 人 们 在 UNIX 标准 化 方面 做 出 的 种 种 努 
力 ， 然 后 讨论 这 些 UNIX 编 程 标准 对 本 书 所 列举 的 各 种 UNIX 操 作 系 统 
实现 的 影响 。 所 有 标准 化 工作 的 一 个 重要 部 分 是 对 每 种 实现 必须 定义 
的 各 种 限制 进行 说 明 ， 所 以 我 们 将 说 明 这 些 限制 以 及 确定 它们 值 的 各 
种 方法 。 


2.2 UNIX 标 准 化 


2.2.1 ISOC 


1989 年 下 半年 ，C 程 序 设计 语言 的 ANSI 标 准 X3.159-1989 得 到 批 
准 。 此 标准 被 也 采纳 为 国际 标准 ISO/IEC 9899:1990。ANSI 是 美国 国家 
标准 学 会 (American National Standards Institute) 的 缩写 ， 它 是 国际 标 


准 化 组 织 (International Organization for Standardization, ISO) 中 代表 
美国 的 成 员 。IEC 是 国际 电子 技术 委员 会 (International Electrotechnical 
Commission) 的 缩写 。 

ISO C 标 准 现在 由 ISO/IEC 的 C 程 序 设计 语言 国际 标准 工作 组 维护 和 
开发 ， 该 工作 组 称 为 ISO/IEC JTCLSC22/WG14， 简 称 WG14 ° ISO CER 
准 的 意图 是 提供 C 程 序 的 可 移植 性 ， 使 其 能 适合 于 大 量 不 同 的 操作 系 
统 ， 而 不 只 是 适合 UNIX 和 系统。 此 标准 不 仅 定 义 了 C 程 序 设计 语言 的 语 
法 和 语义 ， 还 定义 了 其 标准 库 (参见 ISO 1999 第 7 章 ; Plauger[1992]; 
Kernighan 和 Ritchie[1988] 中 的 附录 B) 。 因 为 所 有 现今 的 UNIX 系 统 

(如 本 书 介绍 的 几 个 UNIX 系 统 ) 都 提供 C 标 准 中 定义 的 库 函 数 ， 所 以 
该 标准 库 非常 重要 。 

1999 年 ，ISO C 标 准 税 更 新 ， 并 被 批准 为 ISO/IEC 9899:1999, € T 
著 改 善 了 对 进行 数值 处 理 的 应 用 软件 的 支持 。 除 了 对 某 些 函数 原型 增 
加 了 关键 字 restrict 外 ， 这 种 改变 并 不 影响 本 书 中 描述 的 POSIX 接 口 。 
restrict 关 键 字 告诉 编译 器 ， 哪 些 指 针 引 用 是 可 以 优化 的 ， 其 方法 是 指出 
指针 引用 的 对 象 在 函数 中 只 通过 该 指针 进行 访问 。 

1999 年 以 来 ， 已 经 公布 了 3 个 技术 勤 误 来 修正 ISO C 标 准 中 的 错 
误 ， 分 别 在 2001 年 、2004 年 和 2007 年 公布 。 如 同 大 多 数 标准 一 样 ， 在 
批准 标准 和 修改 软件 使 其 符合 标准 两 者 之 间 有 一 段 时 间 延 迟 。 随 着 供 
应 商 编译 系统 的 不 断 演化 ， 对 最 新 ISO C 标 准 的 文 持 也 就 越 来 越 多 。 

gcc Xj ISO C 标 准 1999 版 本 符合 程度 的 总 结 可 参见 
http://www.gnu.org/c99status. html， 虽 然 C 标 准 已 经 在 2011 年 更 新 ， 但 由 
于 其 他 标准 还 没有 进行 相应 的 更 新 ， 因 此 在 本 书 中 我 们 还 是 沿用 1999 
年 的 版 本 。 

按照 该 标准 定义 的 各 个 头 文件 ( 见 图 2-1) 可 将 ISO C 库 分 成 24 个 
区 。POSIX.1 标 准 包 括 这 些 头 文件 以 及 男 外 一 些 头 文件 。 从 图 2-1 中 可 
以 看 出 ， 所 有 这 些 头 文件 在 4 种 UNIX 实 现 (FreeBSD 8.0 ` Linux 3.2.0 > 


Mac OS X 10.6.8 和 Solaris 10) 中 都 文 持 。 本 章 后 面 将 对 这 4 种 UNIX 实 
现 进 行 说 明 。 

ISO C 尖 文件 依赖 于 操作 系统 所 配置 的 C 编 译 器 的 版 本 。FreeBSD 
8.0 配 置 了 gcc 4.2.1 版 ， Solaris 10 配 置 了 gcc 3.4.3 版 (LAX Sun Studio El 
带 的 C 编 译 器 ) , Ubuntu 12.04 (Linux 3.2.0) 配置 了 gcc 4.6.3 版 ，Mac 
OS X 10.6.8 配 置 了 gcc 4.0.1 和 4.2.1 版 。 


头 文件 FreeBSD 8.0 Linux 3.2.0 MacOSX10.6.8 Solaris 10 


«assert.h» 
<complex.h> 
<ctype.h> 
<errno.h> 
<fenv.h> 
<float.h> 
«inttypes.h» 
<iso646.h> 
<limits.h> 
<locale.h> 
<math.h> 
<setjmp.h> 
<signal.h> 
<stdarg.h> 
<stdbool.h> 
<stddef.h> 
<stdint.h> 
<stdio.h> 
<stdlib.h> 


<string.h> 
<tgmath.h> 
<time.h> 


«wchar.h» 


«wctype.h» 


图 2-1 ISO CERM 


定义 的 头 文件 


验证 程序 断言 
复数 算术 运算 支持 
字符 分 类 和 映射 支持 

出 错 码 (1.7 节 ) 

浮 点 环境 

浮 点 常量 及 特性 
整 型 格式 变换 

赋值 、 关 系 及 一 元 操作 符 宏 
实现 常量 (2.5 节 ) 

本 地 化 类 别 及 相关 定义 
数学 函数 、 类 型 声明 及 常量 
非 局 部 goto (7.10 节 ) 
aS (第 10 章 ) 

可 变 长 度 参数 表 
布尔 类 型 和 值 

标准 定义 

整 型 

ERE VO E (第 5 章 ) 
实用 函数 

字符 串 操 作 
通用 类 型 数学 宏 

时 间 和 日 期 (6.10 节 ) 
扩充 的 多 字 节 和 宽 字 符 支 持 
宽 字符 分 类 和 映射 支持 


2.2.2 IEEE POSIX 


POSIX # — T W) EHIEEE (Institute of Electrical and Electronics 
Engineers， 电 气 和 电子 工程 师 学 会 ) 制订 的 标准 族 。POSIX 指 的 是 可 


移植 操作 系统 接口 (Portable Operating System Interface) 。 它 原来 指 的 
只 是 IEEE 标 准 1003.1-1988 (操作 系统 接口 ) ， 后 来 则 扩展 成 包括 很 多 
标记 为 1003 的 标准 及 标准 草案 ， 如 shell 和 实用 程序 (1003.2) 。 

与 本 书 相 关 的 是 1003.1 操 作 系 统 接口 标准 ， 该 标准 的 目的 是 提升 应 
用 程序 在 各 种 UNIX 系 统 环境 之 间 的 可 移植 性 。 它 定义 了 “符合 POSIX 
的 ”(POSIX compliant) 操作 系统 必须 提供 的 各 种 服务 。 该 标准 已 被 很 
多 计算 机 制造 商 采 用 。 虽 然 1003.1 标 准 是 以 UNIX 操 作 系统 为 基础 的 ， 
但 是 它 并 不 限于 UNIX 和 UNIX 类 的 系统 。 确 实 ， 有 些 提 供 专 有 操作 系 
统 的 制造 商 也 声称 他 们 的 系统 符合 POSIX 〈 同 时 还 保留 所 有 专 有 功 
能 ) 。 

由 于 1003.1 标准 说 明了 一 个 接口 (interface) 而 不 是 一 种 实现 

(implementation) ， 所 以 并 不 区 分 系统 调用 和 库 函 数 。 所 有 在 标准 中 

的 例 程 都 被 称 为 函数 。 

标准 是 不 断 演进 的 ，1003.1 标 准 也 不 例外 。 该 标准 的 1988 版 ， 即 
IEEE 标 准 1003.1-1988 经 修改 后 递交 给 I SO， 它 没有 增加 新 的 接口 或 功 
能 ， 但 修订 了 文本 。 最 终 的 文档 作为 IEEE 标准 1003.1-1990 正式 出 版 
[IEEE 1990]， 这 也 就 是 国际 标准 ISO/IEC 9945-1:1990。 该 标准 通常 称 
为 POSIX.1， 本 书 将 使 用 此 术语 来 表示 不 同 版 本 的 标准 。 

IEEE 1003.1 工 作 组 此 后 继续 对 这 一 标准 做 了 更 多 修改 。1996 年 ， 
该 标准 的 修订 版 发 布 ， 它 包括 了 1003.1-1990、1003.1b-1993 实 时 扩展 标 
准 以 及 被 称 为 pthreads 的 多 线程 编程 接口 〈(POSIX 线 程 ) ， 这 就 是 国际 
标准 ISO/TEC 9945-1:1996。1999 年 出 版 了 IEEE 标 准 1003.1d-1999， 其 中 
增加 了 更 多 实时 接口 。 一 年 后 ， 出 版 了 IEEE 标 准 1003.1j-2000 和 
1003.1q-2000， 前 者 包含 了 更 多 实时 接口 ， 后 者 增加 了 标准 在 事件 跟踪 
方面 的 扩展 。 

2001 年 的 1003.1 版 本 与 以 前 各 版 本 有 较 大 的 差别 ， 它 组 合 了 多 个 
1003.1 的 修正 、1003.2 标 准 以 及 Single UNIX Specificaiton (SUS) 第 2 版 


的 若干 部 分 (对 于 SUS， 后 面 将 进行 更 多 说 明 ) ， 这 形成 了 IEEE 标 准 
1003.1-2001， 它 包括 下 列 几 个 标准 。 

ISO/IEC 9945-1 (IEEE 标 准 1003.1-1996) ， 包 括 

4IEEE 标 准 1003.1-1990 

$IEEE 标 准 1003.1b-1993 (实时 扩展 ) 

4IEEE 标 准 1003.1c-1995 (pthreads) 

4IEEE 标 准 1003.1i-1995 (实时 技术 勘误 表 ) 

IEEE P1003.1a 草 案 (系统 接口 修正 ) 

IEEE 标 准 1003.1d-1999 (高 级 实时 扩展 ) 

IEEE 标 准 1003.1j-2000 (更 多 高 级 实时 扩展 ) 

*IEEE 标 准 1003.1g-2000 (IREF) 

,部 分 IEEE 标 准 1003.1g-2000 (协议 无 关 接 口 ) 

“ISO/IEC 9945-2 (IEEE 标 准 1003.2-1993) 

IEEE P1003.2b 草 案 (shell 及 实用 程序 的 修正 ) 

"IEEE 标 准 1003.2d-1994 ( 批 处 理 扩 展 ) 

Single UNIX Specification 第 2 版 基本 说 明 ， 包 括 

4 系统 接口 定义 ， 第 5 发 行 版 

4 命令 和 实用 程序 ， 第 5 发 行 版 

4 系统 接口 和 头 文 件 ， 第 5 发 行 版 

“开放 组 技术 标准 ， 网 络 服务 ，5.2 发 行 版 

ISO/IEC 9899-1999，C 程 序 设 计 语 言 

2004 年 ，POSIX.1 说 明 随 着 技术 勤 误 得 到 更 新 ，2008 年 做 了 更 多 综 
合 的 改动 并 作为 基本 说 明 的 第 7 发 行 版 发 布 ，ISO 在 2008 年 底 批准 了 
这 个 版 本 并 在 2009 年 进行 发 布 ， 即 国际 标准 ISO/IEC9945:2009。 该 标 
准 基 于 其 他 几 个 标准 。 

。JIEEE 标 准 1003.1，2004 年 版 。 

开放 组 织 技术 标准 ，2006， 扩 展 API 集 ， 第 1~-4 部 分 。 


ISO/IEC 9899:1999， 包 含 勘误 表 ° 

图 2-2、 图 2-3 以 及 图 2-4 总 结 了 POSIX.1 指 定 的 必需 的 和 可 选 的 头 文 
件 。 因 为 POSIX.1 包 含 了 ISO C 标 准 库 函数 ， 所 以 它 还 需要 图 2-1 中 列 出 
的 各 个 头 文 件 。 这 4 张 图 中 的 表 也 总 结 了 本 书 所 讨论 的 4 种 UNIX 系 统 实 


现 所 包含 的 头 文件 。 


«aio.h» 
<cpio.h> 
<dirent.h> 
«dlfcn.h» 
«fcntl.h» 
<fnmatch.h> 
<glob.h> 
<grp.h> 
<iconv.h> 
<langinfo.h> 
<monetary.h> 
<netdb.h> 
<nl_types.h> 
«poll.h» 
<pthread.h> 
<pwd.h> 
<regex.h> 
<sched.h> 
<semaphore.h> 
«strings.h» 
«tar.h» 
«termios.h» 
«unistd.h» 
<wordexp.h> 
<arpa/inet.h> 
<net/if.h> 
<netinet/in.h> 
<netinet/tcp.h> 
<sys/mman.h> 
«sys/select.h» 
«sys/socket.h» 
«sys/stat.h» 
«sys/statvfs.h» 
«sys/times.h» 
«sys/types.h» 


«sys/un.h» 


<sys/utsname.h> 
«sys/wait.h» 


FreeB 
8.0 


SD Linux 
32.0 


Mac OS X 
10.6.8 


异步 VO 

cpio 归档 值 
目录 项 (4.22 节 ) 

动态 链接 
文件 控制 (3.14 节 ) 
文件 名 匹配 类 型 

路 径 名 模式 匹配 与 生成 
组 文件 (6.4 节 ) 
代码 集 变 换 实用 程序 
语言 信息 常量 
货币 类 型 与 函数 

网 络 数 据 库 操作 

消息 类 
投票 函数 (14.4.2 5) 
线程 (第 11 章 、 第 12 章 ) 
口令 文件 (6.2 节 ) 

正则 表达 式 

执行 调度 

信号 量 

字符 串 操作 

tar 归档 值 
终端 IJO (第 18 章 ) 
符号 常量 

字 扩 充 类 型 
因特网 定义 〈 第 16 章 ) 
套 接 字 本 地 接口 〈 第 16 章 ) 
因特网 地 址 族 (16.3 节 ) 
传输 控制 协议 定义 

存储 管理 声明 

select MM (14.4.1 45) 
套 接 字 接 口 (第 16 章 ) 
文件 状态 CRAS) 
文件 系统 信息 
进程 时 间 (8.17 节 ) 

基本 系统 数据 类 型 (2.8 节 ) 
UNIX 域 套 接 字 定义 (17.2 节 ) 
系统 名 〈6.9 Ti) 

进程 控制 〈8.6 节 ) 


图 2-2 POSIX 标 准 定义 的 必需 的 头 文件 


本 书 中 描述 了 POSIX.1 2008 年 版 ， 其 接口 分 成 两 部 分 : 必需 部 分 
和 可 选 部 分 。 可 选 接口 部 分 按 功能 又 进一步 分 成 40 个 功能 分 区 。 图 2-5 


TEC E BUR IAS SAA A Sate eo eI i BES LET 
准 的 2~3 个 字母 的 缩写 ， 用 以 标识 属于 各 个 功能 分 区 的 接口 ， 其 中 的 
接口 依赖 于 特定 选项 的 文 择 。 很 多 选项 处 理 实 时 扩展 。 


EEC 


ees —— | h» 消息 显示 结构 

«ftw.h» 文件 树 漫游 (422 节 ) 
<libgen.h> 路 径 名 管理 函数 

<ndbm.h> 数据 库 操作 

«search.h» 搜索 表 

«syslog.h» 系统 出 错 日 志 记录 (13.4 节 ) 


«utmpx.h» 用 户 账 户 数据 库 
«sys/ipc.h» IPC (15.6 15) 
<sys/msg.h> XSI 消息 队列 (15.7 45) 
<sys/resource.h> 资源 操作 (7.11 节 ) 
«sys/sem.h» XSI fas (15.8 节 ) 
<sys/shm.h> XSI 共 享 存储 (15.945) 
«sys/time.h» 时 间 类 型 
<sys/uio.h> 矢量 VO 操作 (14.6 节 ) 


图 2-3 POSIX 标 准 定义 的 XSI 可 选 头 文件 


<mqueue .h> | 息 队 列 
<spawn.h> 实时 spawn 接口 


图 2-4 POSIX 标 准 定义 的 可 选 头 文件 


选项 码 


SUS 强制 的 


POSIX ADVISORY INFO 
POSIX CPUTIME 
POSIX FSYNC 


POSIX IPV6 


. POSIX MEMLOCK 


POSIX MEMLOCK RANGE 


POSIX MONOTONIC CLOCK 
. POSIX MESSAGE PASSING 
= -STDC IBC 559 

-POSIX PRIORITIZED IO 


-POSIX 
POSIX 
THREAD ROBUST PRIO PROTECT 
POSIX. 
-POSIX 
POSIX. 
-POSIX 
.POSIX. 


POSIX 


POSIX 


PRIORITIZED SCHEDULING 
THREAD ROBUST PRIO INHERIT 


RAW SOCKETS 
SHARED MEMORY OBJECTS 


SYNCHRONIZED IO 


SPAWN 
SPORADIC SERVER 
THREAD CPUTIME 


POSIX 


POSIX. 
_POSTX_ 
POSIX. 


THREAD PRIO INHERIT 
THREAD PRIO PROTECT 

THREAD PRIORITY SCHEDULING 
THREAD ATTR STACKADDR 


POSIX 


POSIX. 


THREAD PROCESS SHARED 
THREAD SPORADIC SERVER 


POSIX 


POSIX. 


THREAD ATTR STACKSIZE 
TYPED MEMORY OBJECTS 


建议 性 信息 《实时 ) 

进程 CPU 时 间 时 钟 〈 实 时 ) 
文件 同步 

IPv6 接口 

进程 存储 区 加 锁 〈 实 时 ) 

存储 区 域 加 锁 〈 实 时 ) 
单调 时 钟 (实时) 

消息 传送 (实时 ) 

IEC 60559 浮 点 选项 
优先 输入 和 输出 

进程 调度 (实时 ) 

健壮 的 互 斥 量 优先 权 继承 〈 实 时 ) 
健壮 的 互 斥 量 优先 权 保护 〈 实 时 ) 
原始 套 接 字 
共享 存储 对 象 〈 实 时 ) 

同步 输入 和 输出 (实时 ) 

产生 实时) 

进程 阵 发 性 服务 器 (实时 ) 
线程 CPU 时 间 时 钟 ( 实 时 ) 


非 键 壮 的 互 斥 量 优先 权 继 承 〈 实 时 ) 
非 键 壮 的 互 斥 量 优 先 权 保护 (实时 ) 
线程 执行 调度 实时) 

线程 栈 地 址 属性 

线程 进程 共享 同步 

线程 阵 发 性 服务 器 (实时 ) 
线程 栈 长 度 属性 

类 型 存储 对 象 ( 实 时 ) 


 XOPEN UNIX X/Open 扩充 接口 


图 2-5 POSIX.1 可 选 接口 组 和 选项 码 


POSIX.1 没有 包括 超级 用 户 (superuser) 这 样 的 概念 ， 代 之 以 规定 

某 些 操作 要 求 “ 适 当 的 优先 权 ”，POSIX.1 将 此 术语 的 含义 留 由 具体 实现 

进行 解释 。 某 些 符合 美国 国防 部 安全 性 指南 要 求 的 UNIX 系 统 具 有 很 多 

不 同 的 安全 级 。 本 书 仍 使 用 传统 的 UNIX 术 语 ， 并 指明 要 求 超级 用 户 特 
权 的 操作 。 

经 过 20 多 年 的 工作 ， 相 关 标 准 已 经 成 熟 稳 定 。POSIX.1 标 准 现 在 由 

Austin Group 开放 工作 组 (http://www.opengroup.org/austin) 维护 。 为 了 


保证 它们 仍然 有 价值 ， 仍 需 经 常 对 这 些 标准 进行 更 新 或 再 确认 。 
2.2.3 Single UNIX Specification 


Single UNIX Specification (SUS， 单 一 UNIX 规 范 ) 是 POSIX.1 标 准 
的 一 个 超 集 ， 它 定义 了 一 些 附 加 接口 扩展 了 POSIX.1 规 范 提 供 的 功能 。 
POSIX.1 相 当 于 Single UNIX Specification 中 的 基本 规范 部 分 。 

POSIX.1 中 的 X/Open 系统 接口 (X/Open System Interface, XSI) 选 
项 描述 了 可 选 的 接口 ， 也 定义 了 遵循 XSI (XSI conforming) 的 实现 必 
须 文 持 POSIX.1 的 哪些 可 选 部 分 。 这 些 必 须 文 持 的 部 分 包括 : 文件 同 
步 、 线 程 栈 地 址 和 长 度 属 性 、 线 程 进程 共享 同步 以 及 _XOPEN_UNIX 符 
号 常量 (在 图 2-5 中 它们 被 加 上 “SUS 强 制 的 * 的 标记 ) 。 只 有 遵循 XSI 的 
实现 才能 称 为 UNIX 系 统 。 

Open Group 拥有 UNIX 商 标 ， 他 们 使 用 Single UNIX Specification 定 
义 了 一 系列 接口 。 一 个 系统 要 想 称 为 UNIX 系统 ， 其 实现 必须 支持 这 
O o UNIX 系统 供应 两 必须 以 文件 形式 提供 符合 性 声明 ， 并 通过 验 
证 符合 性 的 测试 ， 才 能 得 到 使 用 UNIX 商 标的 许可 证 。 

有 些 接口 在 遵循 XS 的 系统 中 是 可 选 的 ， 这 些 接口 根据 功能 被 分 
成 知 干 选项 组 (option group) ， 有 具体 如 下 。 

加密 : 由 符号 常量 XOPEN_CRYPE 标 记 。 

"实时 ， 由 符号 常量 XOPEN_REALTIME 标 记 。 

“高 级 实时 。 

“实时 线程 : 由 符号 常量 XOPEN _REALTIME_THREADS 标 记 。 

“高 级 实时 线程 。 

Single UNIX Specification 是 Open Group 的 出 版 物 ， 而 Open Group 
是 由 两 个 工业 社团 X/Open 和 开放 系统 软件 基金 会 (Open System 
Software Foundation，OSF) 在 1996 年 合并 构成 的 。X/Open 过 去 出 版 了 


X/Open Portability Guide (X/Open 可 移植 性 指南 ) ， 它 采用 了 若干 特定 
标准 ， 填 补 了 其 他 标准 缺失 功能 的 空 日 。 这 些 指南 的 目的 是 改善 应 用 
的 可 移植 性 ， 使 其 不 仅仅 符合 已 发 布 的 标准 。 

X/Open 在 1994 年 发 布 了 Single UNIX Specification 第 1 版 ， 因 为 它 大 
约 包 售 了 1170 个 接口 ， 因 此 也 称 为 “Spec 1170”。 它 源 自 通用 开放 软件 
环境 (Common Open Software Environment, COSE) 的 倡议 ， 该 倡议 
的 目标 是 进一步 改善 应 用 程序 在 所 有 UNIX 操作 系统 实现 之 间 的 可 移 
植 性 。COSE 的 成 员 包括 Sun、IBM、HP、NovelMUSL 以 及 OSF 等 ， 他 
们 的 UNIX 都 包含 了 通用 商业 化 应 用 软件 使 用 的 接口 ， 这 较 之 仅仅 赞同 
和 支持 标准 前 进 了 一 大 步 。 从 这 些 应 用 软件 的 接口 中 选 出 的 1170 82 
口 被 包括 在 下 列 标准 中 : X/Open 通用 应 用 环境 (Common Application 
Environment, CAE) 第 4 发 行 版 (也 被 称 为 XPG4， 以 表示 它 与 其 前 身 
X/Open Portability Guide 的 历史 关系 ) 、 系 统 V 接 口 定义 (System V 
Interface Definition, SVID) 第 3 版 Level 1 接口 、OSF 应 用 环境 规范 

(Application Environment Specification, AES) Full Use##H » 

19974££, Open Group X ffi T Single UNIX Specification 第 2 版 。 新 版 
本 增加 了 对 线程 、 实 时 接口 、64 位 处 理 、 大 文件 以 及 增强 的 多 字 市 字 
符 处 理 等 功能 的 文 持 。 

Single UNIX Specification 第 3 版 (SUSv3) 由 Open Group 在 2001 年 
发 布 。SUSv3 的 基本 规范 与 IEEE 标 准 1003.1-2001 相 同 ， 分 成 4 个 部 分 : 
基本 定义 、 系 统 接口 、shel 和 实用 程序 以 及 基本 理论 。SUSv3 还 包括 
X/Open Curses 第 4 发 行 版 第 2 版 ， 但 该 规范 并 不 是 POSIX.1 的 组 成 部 分 。 

2002 年 ，ISO 将 IEEE 标 准 1003.1-2001 批 准 为 国际 标准 ISO/IEC 
9945:2002 ° Open Group 在 2003 年 再 次 更 新 了 1003.1 标准 ， 包 括 了 技术 
方面 的 更 正 。ISO 将 其 批准 为 国际 标准 ISO/IEC 9945:2003。2004 年 4 
H, Open Group X ffi Į Single UNIX Specification 第 3 版 2004 年 版 ， 将 更 
多 技术 上 的 更 正 合 并 到 标准 的 正文 中 。 


20084F, Single UNIX Specification 再 次 更 新 ， 包 括 了 更 正和 新 的 接 
口 、 移 除 弃 用 的 接口 以 及 将 一 些 未 来 可 能 被 删 除 的 接口 标记 为 弃 用 接 
口 等 。 另 外 ， 有 一 些 过 去 被 认为 可 选 的 接口 变 成 必 选 接口 ， 其 中 包括 
异步 WO、 屏 障 、 时 钟 选择 、 存 储 映像 文件 、 内 存 保护 、 读 写 锁 、 实 时 
言 号 、POSIX 信 号 量 、 旋 转 锁 、 线 程 安全 函数 、 线 程 、 超 时 机 制 以 及 
时 钟 等 。 最 终 形成 的 标准 就 是 基本 规范 的 第 7 发 行 版 ， 也 即 POSIX.1- 
2008 ° Open Group 把 这 个 版 本 和 X/OPEN Curses 规 范 的 更 新 版 打包 ， 并 
于 2010 年 作为 Single UNIX Specification 第 4 版 发 布 。 我 们 把 这 个 规范 称 
为 SUSv4。 


2.2.4 FIPS 


FIPS 代 表 的 是 联邦 信息 处 理 标准 (Federal Information Processing 
Standard) ， 这 一 标准 是 由 美国 政府 发 布 的 ， 并 由 美国 政府 用 于 计算 机 
系统 的 采购 。FIPS151-1 (1989 年 4 月 ) 基于 IEEE 标 准 1003.1-1988 及 
ANSI C 标 准 草案 。 此 后 是 FIPS 151-2 (1993 年 5 月 ) ， 它 基于 IEEE 标 准 
1003.1-1990。 在 POSIX.1 中 列 为 可 选 的 某 些 功能 ， 在 FIPS 151-2 中 是 必 
需 的 。 所 有 这 些 可 选 功能 在 POSIX.1-2001 中 已 成 为 强制 性 要 求 。 

POSIX.1 FIPS 的 作用 是 ， 它 要 求 任 何 希 望 向 美国 政府 销售 符合 
POSIX.1 标 准 的 计算 机 系统 的 厂商 都 应 支持 POSIX.1 的 某 些 可 选 功能 
因为 POSIX.1 FIPS 已 经 撤回 ， 所 以 在 本 书 中 我 们 不 再 进一步 考虑 它 。 


2.3 UNIX 系 统 实现 


上 一 节 说 明了 3 个 由 各 自 独 立 的 组 织 所 制定 的 标准 : ISO C、IEEE 
POSIX 以 及 Single UNIX Specification。 但 是 ， 标 准 只 是 接口 的 规范 。 这 


些 标准 是 如 何 与 现实 世界 相关 连 的 呢 ? 这 些 标准 由 广 商 采用 ， 然 后 转 
变 成 具体 实现 。 本 书 中 我 们 不 仅 对 这 些 标准 感 兴趣 ， 还 对 它们 的 具体 
实现 感 兴趣 。 
在 McKusick 等 [1996] 的 1.1 方 中 给 出 了 UNIX 系 统 家 族 树 的 详细 万 

史 。UNIX 的 各 种 版 本 和 变 体 都 起 源 于 在 PDP-11 系 统 上 运行 的 UNIX 分 
时 系统 第 6 版 (1976 年 ) 和 第 7 版 (1979 年 )”( 通 常 称 为 V6 和 V7) 。 这 
两 个 版 本 是 在 贝尔 实验 室 以 外 首先 得 到 广泛 应 用 的 UNIX 系 统 。 从 这 标 
树 上 演进 出 以 下 3 个 分 文 。 

(1) AT&T 分支 ， 从 此 引出 了 系统 II 和 系统 V 《被 称 为 UNIX 的 商 
用 版 本 ) 。 

(2) 加 州 大 学 伯克利 分 校 分 支 ， 从 此 引出 4.xBSD 实 现 。 

(3) 由 ATI&T 贝 尔 实验 室 的 计算 科学 研究 中 心 不 断 开发 的 UNIX 研 
究 版 本 ， 从 此 引出 UNIX 分 时 系统 第 8 版 、 第 9 版 ， 终 止 于 1990 年 的 第 10 
版 。 


2.3.1 SVR4 


SVR4 (UNIX System V Release 4) 是 AT&T 的 UNIX 系 统 实验 室 
(UNIX System Laboratories, USL ， 其 前 身 是 AT&T 的 UNIX Software 
Operation) 的 产品 ， 它 将 下 列 系统 的 功能 合并 到 了 一 个 一 致 的 操作 系 
Zi: AT&T UNIX 系 统 V 3.2 版 (SVR3.2) ^ Sun Microsystems 公 司 的 
SunOS 操 作 系统 、 加 州 大 学 伯克利 分 校 的 4.3BSD 以 及 微软 的 Xenix 系 统 
(Xenix 是 在 V7 的 基础 上 开发 的 ， 后 来 又 采纳 了 很 多 系统 V 的 功能 ) 
其 源 代码 于 1989 年 后 期 发 布 ， 在 1990 年 开始 向 终端 用 户 提 供 。SVR4 符 
合 POSIX 1003.1 标 准 和 X/Open XPG3 标 准 。 
AT&T 也 出 版 了 系统 V 接 口 定 义 (SVID) [AT&T 1989]。SVID 第 3 
版 说 明了 UNIX 系 统 要 达到 SVR4 质 量 要 求 必 须 提 供 的 功能 。 如 同 


POSIX.1 一 样 ，SVID 定 义 了 一 个 接口 ， 而 不 是 一 种 实现 。SVID 并 不 区 
分 系统 调用 和 库 函 数 。 对 于 一 个 SVR4 的 具体 实现 ， 应 查看 其 参考 手 
册 ， 以 了 解 系统 调用 和 库 函 数 的 不 同 之 处 [AT&T 1990e] ° 


2.3.2 4.4BSD 


BSD (Berkeley Software Distribution) 是 由 加 州 大 学 伯克利 分 校 的 
计算 机 系统 研究 组 (CSRG) 研究 开发 和 分 发 的 。4.2BSD 于 1983 年 问 
世 ，4.3BSD 则 于 1986 年 发 布 。 这 两 个 版 本 都 在 VAX 小 型 机 上 运行 。 它 
们 的 下 一 个 版 本 4.3BSD Tahoe 于 1988 年 发 布 ， 在 一 台 称 为 Tahoe 的 小 型 
机 上 运行 (Leffler 等 [1989] 说 明了 4.3BSD Tahoe 版 ) 。 其 后 又 有 1990 年 
的 4.3BSD Reno 版 ， 它 文 持 很 多 POSIX.1 的 功能 。 

最 初 的 BSD 系 统 包含 了 AT&T 专 有 的 源 代码 ， 它 们 需要 AT&T 许 可 
证 。 为 了 获得 BSD 系 统 的 源 代码 ， 首 先 需 要 持 有 AT&T 的 UNIX 源 代 
码 许可 证 。 这 种 情况 正在 改变 ， 近 几 年 ， 越 来 越 多 的 AT&T 源 代码 被 蔡 
换 成 非 AT&T 源 代码 ， 很 多 添加 到 BSD 系 统 上 的 新 功能 也 来 自 于 非 
AT&T 方 面 。 

1989 年 ， 伯 克利 将 4.3BSD Tahoe 中 很 多 非 AT&T 源 代码 包装 成 BSD 
网 络 软 件 1.0 版 ， 并 使 其 成 为 可 公开 获得 的 软件 。1991 年 发 布 了 BSD 网 
络 软 件 2.0 版 ， 它 是 从 4.3BSD Reno 版 派生 出 来 的 ， 其 目的 是 使 大 部 分 

(如 果 不 是 全 部 的 话 ) 4.4BSD 系 统 不 再 受 AT&T 许 可 证 的 限制 ， 这 样 ， 
大 家 都 可 以 得 到 源 代码 。 

4.4BSD-Lite 是 CSRG 计 划 开 发 的 最 后 一 个 发 行 版 。 由 于 与 USL 产 生 
的 法 律 纠纷 ， 该 版 本 曾 一 度 延 迟 推 出 。 在 纠纷 解决 后 ，4.4BSD-Lite Z 
即 于 1994 年 发 布 ， 并 日 不 再 需要 具有 UNIX 源 代码 使 用 许可 证 就 可 以 使 
用 它 。1995 年 CSRG 发 布 了 修复 了 bug 的 版 本 。4.4BSD-Lite 第 2 发 行 版 是 
CSRG 的 最 后 一 个 BSD 版 本 (McKusick 等 [1996] 描 述 了 该 BSD 版 本 ) 。 


在 伯克利 所 进行 的 UNIX 开 发 工作 是 从 PDP-11 开 始 的 ， 然 后 转移 到 
VAX 人 小 型 机 上 ， 接 着 又 转移 到 工作 站 上 。20 世纪 90 年 代 早 期 ， 伯 克利 
得 到 支持 在 广泛 应 用 的 80386 个 人 计算 机 上 开发 BSD 版 本 ， 结 果 产 生 
了 386BSD。 这 一 工作 是 由 Bill Jolitz 完 成 的 ， 其 工作 在 1991 年 全 年 的 
DrDobb's 期 刊 上 以 每 月 一 篇 文章 连载 发 表 。 其 中 很 多 代码 出 现在 BSD 
网 络 软件 2.0 版 中 。 


2.3.3 FreeBSD 


FreeBSD 基 于 4.4BSD-Lite 操作 系统 。 在 加 州 大 学 伯克利 分 校 的 
CSRG 决 定 终 止 其 在 UNIX 操 作 系 统 的 BSD 版 本 的 研发 工作 ， 而 且 
386BSD 项 目 被 忽视 很 长 时 间 之 后 ， 为 了 继续 坚持 BSD 系 列 ， 形 成 了 
FreeBSD 项 目 。 

由 FreeBSD 项 目 产生 的 所 有 软件 ， 包 括 其 二 进 制 代码 和 源 代 码 ， 都 
是 免费 使 用 的 。 为 了 测试 书 中 的 实例 ， 本 书 选 取 了 4 个 操作 系统 ， 
FreeBSD 8.0 探 作 系 统 是 其 中 之 一 。 

有 许多 基于 BSD 的 免费 操作 系统 。 NetBSD WE 

(http://www.netbsd.org) 类 似 于 FreeBSD 项 目 ， 但 是 更 注重 不 同 硬件 平 
台 之 间 的 可 移植 性 。OpenBSD 项 目 (http://www.openbsd. org) 也 类 似 
于 FreeBSD 项 目 ， 但 更 注重 于 安全 性 。 


2.3.4 Linux 


Linux 是 一 种 提供 类 似 于 UNIX 的 丰富 编程 环境 的 操作 系统 ， 在 
GNU 公 用 许可 证 的 指导 下 ， Linux 是 免费 使 用 的 。Linux 的 普及 是 计算 
机 产业 中 的 一 道 亮丽 风景 线 。Linux 经 常 是 支持 较 新 硬件 的 第 一 个 操作 
系统 ， 这 一 点 使 其 引 人 注 目 。 


Linux Linus Torvalds 在 1991 年 为 奉 代 MINIX 而 研发 的 。 一 位 当 
时 名 不 见 经 传人 物 的 努力 掀起 了 涪 洲 巨 浪 ， 吸 引 了 遍布 全 世界 的 很 多 
软件 开发 者 ， 在 使 用 和 不 断 增强 Linux 方 面 自愿 贡献 出 了 他 们 大 量 的 时 
间 。 

Ubuntu 12.04 的 Linux 分 发 版 本 是 用 以 测试 本 书 实例 的 操作 系统 
一 。 该 系统 使 用 了 Linux 操 作 系 统 3.2.0 版 内 核 。 


2.3.5 Mac OS X 


与 其 以 前 的 版 本 相 比 ，Mac OS X 使 用 了 完全 不 同 的 技术 。 其 核心 
操作 系统 称 为 “Darwin”， 它 基于 Mach 内 核 (Accetta 等 [1986]) 
FreeBSD 操 作 系 统 以 及 具有 面向 对 象 框架 的 驱动 和 其 他 内 核 扩 展 的 结 
合 。Mac OS X 10.5 的 Intel 部 分 已 经 被 验证 为 是 一 个 UNIX 系 统 。 (关于 
UNIX % 证 的 更 多 fF A ， 请 B WM 
http://www.opengroup.org/certification/idx/UNIX.html) 。 

Mac OS X 10.6.8 (Darwin 10.8.0) 是 用 以 测试 本 书 实例 的 操作 系统 
之 一 。 


2.3.6 Solaris 


Solaris Æ HH Sun Microsystems 〈 现 为 Oracle) 开发 的 UNIX 系 统 版 
本 。 它 基于 SVR4， 在 超过 15 年 的 时 间 里 ，Sun Microsystems 的 工程 师 
对 其 功能 不 断 增强 。 它 是 唯一 在 商业 上 取得 成 功 的 SVR4 后 衣 ， 并 被 正 
式 验证 为 UNIX 系 统 。 

2005 年 ，Sun Microsystems 把 Solaris 操 作 系 统 的 大 部 分 源 代码 开放 
给 公众 ， 作 为 OpenSolaris 开 放 源 代码 操作 系统 的 一 部 分 ， 试 图 建立 
绕 Solaris 的 外 部 开发 人 员 社 区 。 

Solaris 10 UNIX 操 作 系统 也 是 用 以 测 旗本 书 实例 的 操作 系统 之 一 。 


24.7 UNIX 3 SJL 


已 经 通过 验证 的 其 他 UNIX 版 本 包括 : 
“AIX，IBM 版 的 UNIX 系 统 ; 

HP-UX，HP 版 的 UNIX 系 统 ; 

*IRIX, Silicon Graphics 版 的 UNIX 系 统 ; 
“UnixWare，SVR4 派 生 的 UNIX 系 统 ， 现 由 SCO 销 售 。 


2.4 水 实现 JIN 


前 面 提 到 的 各 个 标准 定义 了 任 一 实际 系统 的 子 集 。 本 书 主 要 关注 4 
种 实际 的 UNIX 系 统 : FreeBSD 8.0 ` Linux 3.2.0 ` Mac OS X 10.6.8 和 
Solaris 10。 在 这 4 种 系统 中 ， 虽 然 只 有 Mac OS X 和 Solaris 10 能 够 称 目 
己 是 一 种 UNIX 系 统 ， 但 是 所 有 这 4 种 系统 都 提供 UNIX 编 程 环境 。 因 为 
所 有 这 4 种 系统 都 在 不 同 程度 上 符合 POSIX 标 准 ， 所 以 我 们 也 将 重点 关 
注 POSIX.1 标 准 所 要 求 的 功能 ， 并 指出 这 4 种 系统 具体 实现 与 POSIX 之 
间 的 差别 。 仅 仅 一 个 特定 实现 所 具有 的 功能 和 例 程 会 被 清楚 地 标记 出 
来 。 我 们 还 关注 那些 属于 UNIX 系 统 必 需 的 ， 但 却 在 符合 POSIX 标 准 的 
系统 中 是 可 选 的 功能 。 

应 当 看 到 ， 这 些 实现 都 提供 了 对 它们 早期 版 本 (如 SVR3.2 和 
4.3BSD) 功能 的 向 后 兼容 性 。 例 如 ，Solaris 对 POSIX.1 规范 中 的 非 阻 
3€ I/O (O NONBLOCK) 以 及 传统 的 系统 V 中 的 方法 (O NDELAY) 
都 提供 了 支持 。 本 书 将 只 使 用 POSIX.1 的 功能 ， 但 是 也 会 提 及 它 所 替换 
的 是 哪 一 种 非 标准 功能 。 与 此 相 类 似 ，SVR3.2 和 4.3BSD 以 某 种 方法 提 
供 了 可 靠 的 信号 机 制 ， 这 种 方法 也 有 别 于 POSIX.1 标 准 。 第 10 章 将 只 说 
明 POSIX.1 的 信号 机 制 。 


2.5 限制 


UNIX 系统 实现 定义 了 很 多 幻 数 和 和 常量， 其 中 有 很 多 已 被 硬 编码 到 
程序 中 ， 或 用 特定 的 技术 确定 。 由 于 大 量 标准 化 工作 的 努力 ， 已 有 若 
干 种 可 移植 的 方法 用 以 确定 这 些 弘 ] 数 和 具体 实现 定义 的 限制 。 这 非常 
有 助 于 改善 UNIX 环 境 下 软件 的 可 移植 性 。 

以 下 两 种 类 型 的 限制 是 必需 的 。 

(1) 编译 时 限制 (例如 ， 短 整 型 的 最 大 值 是 什么 ? ) 
(2) 运行 时 限制 例如， 文件 名 有 多 少 个 字符 ? ) 

编译 时 限制 可 在 头 文件 中 定义 。 程 序 在 编译 时 可 以 包含 这 些 头 文 
件 。 但 是 ， 运 行 时 限制 则 要 求 进 程 调用 一 个 函数 获得 限制 值 。 

另外 ， 某 些 限 制 在 一 个 给 定 的 实现 中 可 能 是 固定 的 〈 因 此 可 以 静 
态 地 在 一 个 头 文件 中 定义 ) ， 而 在 另 一 个 实现 中 则 可 能 是 变动 的 〈 需 
要 有 一 个 运行 时 函数 调用 ) 。 这 种 类 型 限制 的 一 个 例子 是 文件 名 的 最 
大 字符 数 。SVR4 之 前 的 系统 V 由 于 历史 原因 只 人 允许 文件 名 最 多 包含 14 
个 字符 ， 而 源 于 BSD 的 系统 则 将 此 增加 为 255。 目 前 ， 大 多 数 UNIX 系 
统 文 持 多 文件 系统 类 型 ， 而 每 一 种 类 型 有 它 目 己 的 限制 。 文 件 名 的 最 
大 长 度 依赖 于 该 文件 处 于 何 种 文件 系统 ， 例 如 ， 根 文件 系统 中 的 文件 
名 长 度 限 制 可 能 是 14 个 字符 ， 而 在 另 一 个 文件 系统 中 文件 名 长 度 限 制 
可 能 是 255 个 字符 ， 这 是 运行 时 限制 的 一 个 例子 。 

为 了 解决 这 类 问题 ， 提 供 了 以 下 3 种 限制 。 

(1) 编译 时 限制 (AAE) 。 

(2) 与 文件 或 目录 无 关 的 运行 时 限制 (sysconf 函 数 ) ° 

(3) 与 文件 或 目录 有 关 的 运行 时 限制 ( pathconf 4 fpathconf ER 
ŽO 。 


TESTE SETS RIAN, WAR 
定 的 系统 上 并 不 改变 ， 则 可 将 其 
WRAN 
一 个 (我们 很 快 融会 对 它们 进 


行 说 明 ) ， 以 确定 其 
2.5.1 ISO C 限 制 


个 特定 的 运行 时 限制 在 一 个 给 
静态 地 定义 在 一 个 头 文 件 中 ， 但 是 ， 
其 定义 在 头 文件 中 ， 应 用 程序 就 必须 调用 3 个 conf 函 数 中 的 
运行 时 的 值 。 


ISO C 定 义 的 所 有 编译 时 限制 都 列 在 头 文件 <limitsh> 中 〈 见 图 2- 


o CES BR itil Fy Be TE 
ISO C 标 准 可 接受 的 最 小 值 。 


一 个 给 


定 系 统 中 并 不 会 改变 。 表 中 第 3 列 列 出 了 
这 用 于 16 位 整 型 的 系统 ， 用 1 的 补 码 表 


示 。 第 4 列 列 出 了 32 位 整 型 Linux 系 统 的 值 ， 用 2 的 补 码 表示 。 注 意 ， 我 


们 没有 列 出 无 符号 数据 类 型 的 最 小 值 ， 
其 long 整 型 的 最 大 值 与 表 中 long long 整 型 的 最 大 值 相 匹配 。 


HE. 


名 | 5m 


CHAR BIT | BIT 
CHAR_MAX 
CHAR_MIN 
SCHAR_MAX 
SCHAR_MIN 
UCHAR_MAX 
INT_MAX 
INT_MIN 
UINT_MAX 
SHRT_MAX 
SHRT_MIN 
USHRT_MAX 
LONG_MAX 
LONG_MIN 
ULONG MAX 
LLONG_MAX 
LLONG_MIN 
ULLONG MAX 


char | car | 数 

char 的 最 大 值 -— 
char 的 最 小 值 〈 见 后 ) 
signed char 的 最 大 值 127 
signed char 的 最 小 值 127 
unsigned char 的 最 大 值 255 
int 的 最 大 值 32 767 
int 的 最 小 值 32 767 
unsigned int 的 最 大 值 65 535 
short 的 最 大 值 32 767 
short 的 最 小 值 32 767 
unsigned short 的 最 大 值 65 535 
long 的 最 大 值 2 147 483 647 
long 的 最 小 值 2 147 483 647 
unsigned long 的 最 大 值 4 294 967 295 
long long 的 最 大 值 9 223 372 036 854 775 807 
long long 的 最 小 值 9 223 372 036 854 775 807 
18 446 744 073 709 551 615 


unsigned long long 的 最 大 值 


这 些 值 应 该 都 为 0。 


在 64 位 系统 


2147 483 647 
2 147 483 648 
4294 967 295 
32 767 
32 768 
65 535 
2 147 483 647 
2 147 483 648 
4 294 967 295 


9 223 372 036 854 775 807 
9 223 372 036 854 775 808 
18 446 744 073 709 551 615 


MB LEN MAX 


在 一 个 多 字 节 字符 常量 中 的 最 大 字 节 数 1 


图 2-6 <limits.h> 中 定义 的 整 型 值 大 小 
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我 们 将 会 遇 到 的 一 个 区 别 是 系统 是 否 提供 带 符 号 或 无 符号 的 的 字 
符 值 。 从 图 2-6 中 的 第 4 列 可 以 看 出 ， 该 特定 系统 使 用 带 符号 字符 。 从 图 
中 可 以 看 到 CHAR_MIN 5$ T SCHAR MIN, CHAR MAX 等 于 
SCHAR_MAX。 如 有 果 系 统 使 用 无 符号 字符 ， 则 CHAR_MIN 等 于 0， 
CHAR_MAX 等 于 UCHAR_MAX ° 

在 头 文件 <floath> 中 ， 对 浮 点 数据 类 型 也 有 类 似 的 一 组 定义 。 如 寿 
读者 在 工作 中 涉及 大 量 浮 点 数据 类 型 ， 则 应 仔细 得 看 该 文件 。 

虽然 ISO C 标 准 规定 了 整 型 数据 类 型 可 接受 的 最 小 值 ， 但 POSIX.1 
对 C 标 准 进行 了 扩充 。 为 了 符合 POSIX.1 标 准 ， 具 体 实现 必须 支持 
INT MAX 的 最 小 值 为 2 147 483 647, INT MIN 732 147 483 647, 
UINT. MAX7JA 294 967 295。 因 为 POSIX.1 要 求 具体 实现 支持 8 位 的 char 
类 型 ， 所 以 CHAR_ BIT 必须 是 8，SCHAR MIN 必须 是 -128 , 
SCHAR_MAX 必 须 是 127，UCHAR_MAX 必 须 是 255 ° 

我 们 会 遇 到 的 另 一 个 ISO C 常 量 是 FOPEN_MAX， 这 是 具体 实现 保 
证 可 同时 打开 的 标准 IO 流 的 最 小 个 数 ， 该 值 在 头 文件 <stdio.h> 中 定 
义 ， 其 最 小 值 是 8。POSIX.1 中 的 STREAM_MAX ( 若 定义 的 话 ) 则 应 
与 FOPEN_MAX 具 有 相同 的 值 。 

ISO Cif <stdio.h> FE X. T 4$ &TMP. MAX, iGéHitmpnamER ZA 
产生 的 唯一 文件 名 的 最 大 个 数 。 关 于 此 常量 我 们 将 在 5.13 方 中 进行 更 多 
说 明 。 

虽然 ISO C 定 义 了 常量 FILENAME_MAX， 但 我 们 应 避免 使 用 该 常 
E, Jj POSIX.1 fe Bk T 9" Wf HN CE [€ (NAME MAX 和 
PATH MAX) ， 我 们 很 快 就 会 介绍 该 常量 。 

TE Ed 2-7 P , RNA STAB He 4H S rH 
FILENAME MAX ` FOPEN MAXTITMP MAXÍÉ ° 


限制 FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 Solaris 10 
20 6 20 


FOPEN MAX ] 
TMP MAX 308 915 776 238 328 308 915 776 
FILENAME MAX 1 024 4 096 1 024 


图 2-7 在 各 种 平台 上 ISO 的 限制 


2.5.2 POSIX 限 制 


POSIX.1 定 义 了 很 多 涉及 操作 系统 实现 限制 的 常量 ， 遗 憾 的 是 ， 这 
是 POSIX.1 中 最 令 人 迷惑 不 解 的 部 分 之 一 。 虽 然 POSIX.1 定 义 了 大 量 限 
制 和 常量 ， 我 们 只 关心 与 基本 POSIX.1 接 口 有 关 的 部 分 。 这 些 限 制 和 常 
量 分 成 下 列 7 类 。 

(1) 数值 限制 : LONG_BIT、SSIZE_ MAX 和 WORD_BIT。 

(2) 最 小 值 : 图 2-8 中 的 25 个 常量 。 

(3) 最 大 值 :_POSIX_CLOCKRES_MIN ° 

(4) 运行 时 可 以 增加 的 值 : CHARCLASS NAME MAX ^ 
COLL WEIGHTS MAX ^ LINE MAX ^ NGROUPS MAX 和 
RE DUP MAX ° 

(5) 运行 时 不 变 值 (可 能 不 确定 ) : 图 2-9 中 的 17 个 常量 (加 上 
12.2 节 中 介绍 的 4 个 常量 和 14.5 节 中 介绍 的 3 个 常量 ) 。 

(6) 其 他 不 变 值 : NL ARGMAX ` NL MSGMAX ` 
NL_SETMAXAINL TEXTMAX ° 

(7) 路 径 名 可 变 值 : FILESIZEBITS ^ LINK MAX ^ 
MAX CANON ` MAX INPUT ^ NAME MAX ` PATH MAX ^ 
PIPE BUFfISYMLINK MAX ° 

在 这 些 限 制 和 常量 中 ， 某 些 可 能 定义 在 <limits.h> 中 ， 其 余 的 则 按 
具体 条 件 可 定义 、 可 不 定义 。 在 2.5.4 广 中 说 明 sysconf、pathconf 和 


fpathconf 函 数 时 ， 我 们 将 描述 可 定义 或 可 不 定义 的 限制 和 常量 。 在 图 2- 
8 中 ， 我 们 列 出 了 25 个 最 小 值 。 

这 些 最 小 值 是 不 变 的 一 它们 并 不 随 系 统 而 改变 。 它 们 指定 了 这 些 
特征 最 具 约 束 性 的 值 。 一 个 符合 POSIX.1 的 实现 应 当 提 供 至 少 这 样 大 的 
值 。 这 束 是 为 什么 将 它们 称 为 最 小 值 ， 虽 然 它 们 的 名 字 都 包含 了 
MAX。 另 外 ， 为 了 保证 可 移植 性 ， 一 个 严格 符合 POSIX 标 准 的 应 用 程 
序 不 应 要 求 更 大 的 值 。 我 们 将 在 本 书 的 适当 章 忆 说 明 每 一 个 常量 的 含 
x. o 


一 个 严格 符合 (strictly conforming) POSIX 的 应 用 区 别 于 一 个 刚刚 
符合 POSIX (merely POSIX confirming) 的 应 用 。 符 合 POSIX 的 应 用 只 
使 用 在 IEEE 1003.1-2001 中 定义 的 接口 。 严 格 符合 POSIX 的 应 用 满足 更 
多 的 限制 ， 例 如 ， 不 依赖 于 POSIX 未 定义 的 行为 、 不 使 用 其 任何 已 弃 
用 的 接口 以 及 不 要 求 所 使 用 的 常量 值 大 于 图 2-8 中 所 列 出 的 最 小 值 。 


说 明 : 最 小 可 接受 值 


POSIX ARG MAX exec 函数 的 参数 长 度 
POSIX CHILD MAX 每 个 实际 用 户 ID 的 子 进程 数 
POSIX DELAYTIMER MAX | 定时 器 最 大 超 限 运 行 次 数 
POSIX HOST NAME MAX | gethostname 函数 返回 的 主机 名 长 度 
POSIX LINK MAX 至 一 个 文件 的 链接 数 
POSIX LOGIN NAME MAX | 登录 名 的 长 度 
POSIX MAX CANON 终端 规范 输入 队列 的 字 节 数 
POSIX MAX INPUT 终端 输入 队列 的 可 用 空间 
POSIX NAME MAX 文件 名 中 的 字 节 数 ， 不 包括 终止 null 字 节 
POSIX NGROUPS MAX 每 个 进程 同时 添加 的 组 ID 数 
POSIX OPEN MAX 每 个 进程 的 打开 文件 数 
POSIX PATH MAX 路 径 名 中 的 字 节 数 ， 包 括 终 止 null 字 节 


POSIX PIPE BUF 能 原子 地 写 到 一 个 管道 中 的 字 节 数 


当 使 用 间隔 表示 法 \{m, n\t, regexec 和 regcomp 函数 允许 
的 基本 正则 表达 式 重 复发 生 次 数 
POSIX RTSIG MAX 为 应 用 预 留 的 实时 信号 编号 个 数 
_POSIX SEM NSEMS MAX 一 个 进程 可 以 同时 使 用 的 信号 量 个 类 
POSIX SEM VALUE MAX | 信号 量 可 持 有 的 值 
POSIX SIGQUEUE MAX -个 进程 可 发 送 和 挂 起 的 排队 信号 的 个 数 
POSIX SSIZE MAX 能 存在 ssize t 对 象 中 的 值 
POSIX STREAM MAX 一 个 进程 能 同时 打开 的 标准 VO 流 数 
POSIX SYMLINK MAX 符号 链接 中 的 字 节 数 

POSIX SYMLOOP MAX 在 解析 路 径 名 时 ， 可 遍历 的 符号 链接 数 
_POSIX TIMER MAX 每 个 进程 的 定时 器 数目 
POSIX TTY NAME MAX 终端 设备 名 长 度 ， 包 括 终 止 null 字 节 
POSIX TZNAME MAX 时 区 名 字 节 数 


POSIX RE DUP MAX 


图 2-8 <limits.h> 中 的 POSIX.1 最 小 值 


遗憾 的 是 ， 这 些 不 变 最 小 值 中 的 某 一 些 在 实际 应 用 中 太 小 了 。 例 
如 ， 目 前 在 大 多 数 UNIX 系 统 中 ， 每 个 进程 可 同时 打开 的 文件 数 远 远 超 
过 20。 另 外 ，_POSIX_PATH_MAX 的 最 小 限制 值 为 255， 这 太 小 了 ， 路 
径 名 可 能 会 超过 这 一 限制 。 这 意味 着 在 编译 时 不 能 使 用 
POSIX OPEN MAX fill. POSIX. PATH. MAX 这 两 个 常量 作为 数组 长 
度 o 

图 2-8 中 的 25 个 不 变 最 小 值 的 每 一 个 都 有 一 个 相关 的 实现 值 ， 其 名 
字 是 将 图 2-8 中 的 名 字 删 除 前 缀 _POSIX_ 后 构成 的 。 没 有 _POSIX_ 前 绥 
的 名 字 用 于 给 定 具 体 实 现 支持 的 该 不 变 最 小 值 的 实际 值 (这 25 个 实现 


值 是 本 节 开 始 部 分 所 列 出 的 1、4、5、7 类 : 2 个 是 运行 时 可 以 增加 的 
值 、15 个 是 运行 时 不 变 值 、7 个 是 路 径 名 可 变 值 ， 以 及 数值 
SSIZE MAX) 。 问 题 是 并 不 能 确保 所 有 这 25 个 实现 值 都 在 <limit.h> 头 
文件 中 定义 。 

例如 ， 某 个 特定 值 可 能 不 在 此 头 文件 中 定义 ， 其 理由 是 : 一 个 给 
定 进 程 的 实际 值 可 能 依赖 于 系统 的 存储 总 量 。 如 果 没 有 在 头 文件 中 定 
义 它 们 ， 则 不 能 在 编译 时 使 用 它们 作为 数组 边界 。 所 以 ，POSIX.1 提 供 
了 3 个 运行 时 函数 以 供 调 用 ， 它 们 是 : sysconf、pathconf 以 及 fpathconf ° 
使 用 这 3 个 函数 可 以 在 运行 时 得 到 实际 的 实现 值 。 但 是 ， 还 有 一 个 问 
题 ， 其 中 某 些 值 由 POSIX.1 定义 为 “可 能 不 确定 的 ” 《逻辑 上 无 限 
HJ) ， 这 就 意味 着 该 值 没 有 实际 上 限 。 例 如 ， 在 Solaris 中 ， 进 程 结束 时 
注册 可 运行 atexit 的 函数 个 数 仅 受 系 统 存 储 总 量 的 限制 。 所 以 在 Solaris 
中 ，ATEXIT_MAX 被 认为 是 不 确定 的 。2.5.5 市 还 将 讨论 运行 时 限制 不 
确定 的 问题 。 


名 称 说 明 


ARG MAX exec 函数 族 的 参数 最 大 长 度 _POSIX ARG MAX 
ATEXIT MAX 可 用 atexit 函数 登记 的 最 大 函数 个 数 32 


最 小 可 接受 值 


CHILD MAX 
DELAYTIMER MAX 
HOST NAME MAX 
LOGIN NAME MAX 
OPEN MAX 
PAGESIZE 
RTSIG MAX 

SEM NSEMS MAX 
SEM VALUE MAX 
SIGQUEUE MAX 
STREAM MAX 
SYMLOOP MAX 
TIMER MAX 

TTY NAME MAX 
TZNAME MAX 


每 个 实际 用 户 ID 的 子 进 程 最 大 个 数 
定时 器 最 大 超 限 运行 次 数 
gethostname 返回 的 主机 名 长 度 
登录 名 最 大 长 度 
赋予 新 建文 件 描述 符 的 最 大 值 +1 
系统 内 存 页 大 小 (以 字 节 为 单位 》 
为 应 用 程序 预 留 的 实时 信号 的 最 大 个 数 
一 个 进程 可 使 用 的 信号 量 最 大 个 数 
信号 量 的 最 大 值 
-个 进程 可 排队 信号 的 最 大 个 数 
一 个 进程 一 次 可 打开 的 标准 VO 流 的 最 大 个 数 
路 径 解 析 过 程 中 可 访问 的 符号 链接 数 
一 个 进程 的 定时 器 最 大 个 数 
终端 设备 名 长 度 ， 其 中 包括 终止 的 null 字 节 
时 区 名 的 字 节 数 


POSIX CHILD MAX 
POSIX DELAYTIMER MAX 
POSIX HOST NAME MAX 
POSIX LOGIN NAME MAX 
POSIX OPEN MAX 
1 
POSIX RTSIG MAX 
POSIX SEM NSEMS MAX 
POSIX SEM VALUE MAX 
POSIX SIGQUEUE MAX 
POSIX STREAM MAX 
POSIX SYMLOOP MAX 
POSIX TIMER MAX 
POSIX TTY NAME MAX 
POSIX TZNAME MAX 


图 2-9 <limits.h> 中 的 POSIX.1 运 行 时 不 变 值 


2.5.3 XSI 


XSI 定 义 了 代表 实现 限制 的 几 个 常量 。 
(1) 最 小 值 : 图 2-10 中 列 出 的 5 个 常量 。 
(2) 运行 时 不 变 值 (可 能 不 确定 ) : IOV_MAX 和 PAGE SIZE ° 
图 2-10 列 出 了 最 小 值 。 最 后 两 个 常量 值 说 明了 POSIX.1 最 小 值 太 
小 的 情况 ， 根 据 推测 这 可 能 是 考虑 到 了 退 入 式 POSIX.1 实 现 。 为 此 ， 
Single UNIX Specification 为 符合 XSI 的 系统 增加 了 具有 较 大 最 小 值 的 符 


说 明 


NL LANGMAX 在 LANG 环境 变量 中 最 大 字 节 数 
NZERO 默认 进程 优先 级 


XOPEN IOV MAX readv 或 writev 可 使 用 的 最 多 iovec 结构 个 数 
 XOPEN NAME MAX 文件 名 中 的 字 节 数 
XOPEN PATH MAX 路 径 名 中 的 字 节 数 


图 2-10 <limits.h> 中 的 XSI 最 小 值 


2.5.4 函数 sysconf、pathconf 和 fpathconf 


我 们 已 列 出 了 实现 必须 支持 的 各 种 最 小 值 ， 但 是 怎样 才能 找到 一 
个 特定 系统 实际 支持 的 限制 值 呢 ?正如 前 面 提 到 的 ， 某 些 限制 值 在 编 
译 时 是 可 用 的 ， 而 男 外 一 些 则 必须 在 运行 时 确定 。 我 们 也 兽 提 太 某 些 
限制 值 在 一 个 给 定 的 系统 中 可 能 是 不 会 更 改 的 ， 而 其 他 限制 值 可 能 会 
更 改 ， 因 为 它们 与 文件 和 目 永 相关 联 。 运 行 时 限制 可 调用 下 面 3 个 函数 
之 一 获得 。 


#include <unistd.h> 


long sysconf(int name); 
long pathconf(const char *pathname, int name); 


log fpathconf(int fd, int name); 


所 有 函数 返回 值 ， 若 成 功 ， 返 回 相 应 值 ， 若 出 错 ， 返 回 -1 (Wea) 

后 面 两 个 函数 的 差别 是 : 一 个 用 路 径 名 作为 其 参数 ， 另 一 个 则 取 
文件 描述 符 作 为 参数 。 

图 2-11 中 列 出 了 sysconf 芳 数 所 使 用 的 name 参 数 ， 它 用 于 标识 系统 
限制 。 以 _SC_ 开 始 的 常量 用 作 标 识 运 行 时 限制 的 sysconf 参 数 。 图 2-12 
列 出 了 pathconf 和 fpathconf 函 数 为 标识 系统 限制 所 使 用 的 name 参 数 。 以 
_PC_ 开 始 的 常量 用 作 标 识 运 行 时 限制 的 pathconf 或 fpathconf 参 数 。 

我 们 需要 更 详细 地 讨论 一 下 这 3 个 函数 不 同 的 返回 值 。 

(1) 如 果 name 参 数 并 不 是 一 个 合适 的 常量 ， 这 3 个 函数 都 返回 
-1， 并 把 errno 置 为 EINVAL。 图 2-11 和 图 2-12 的 第 3 列 给 出 了 我 们 在 整 
本 书 中 将 要 涉及 的 限制 常量 。 

(2) 有 些 name 会 返回 一 个 变量 值 (返回 值 >20) 或 者 提示 该 值 是 不 
确定 的 。 不 确定 的 值 通过 返回 -1 来 体现 ， 而 不 改变 ermo 的 值 。 


ARG MAX 
ATEXIT MAX 
CHILD MAX 
时 钟 滴答 / 秒 


COLL WEIGHTS MAX 


DELAYTIMER MAX 


HOST NAME MAX 
IOV MAX 


LINE MAX 
LOGIN NAME MAX 
NGROUPS MAX 
OPEN MAX 
PAGESIZE 

PAGE SIZE 

RE DUP MAX 


RTSIG MAX 
SEM NSEMS MAX 
SEM VALUE MAX 


SIGQUEUE MAX 
STREAM MAX 


SYMLOOP MAX 
TIMER MAX 
TTY NAME MAX 
TZNAME MAX 


.SC ARG MAX 

.SC ATEXIT MAX 

.SC CHILD MAX 

.SC CLK TCK 

.SC COLL WEIGHTS MAX 


exec 函数 的 参数 最 大 长 度 〈 字 节 ) 

可 用 atexit 函数 登记 的 最 大 函数 个 数 

每 个 实际 用 户 ID 的 最 大 进程 数 

每 秒 时 钟 滴 答 数 

在 本 地 定义 文件 中 可 以 赋予 LC_COLLATE 顺序 关 
键 字 项 的 最 大 权重 数 

定时 器 最 大 超 限 运行 次 数 

gethostname 函数 返回 的 主机 名 最 大 长 度 

readv 或 writev 函数 可 以 使 用 最 多 的 iovec fi 
构 的 个 数 

实用 程序 输入 行 的 最 大 长 度 

登录 名 的 最 大 长 度 

每 个 进程 同时 添加 的 最 大 进程 组 ID 数 

每 个 进程 最 大 打开 文件 数 

系统 存储 页 长 度 〈 字 节 数 ) 

系统 存储 页 长 度 〈 字 节 数 ) 

当 使 用 间隔 表示 法 \{m,n\} 时 ， 函 数 regexec 和 

regcomp 允许 的 基本 正则 表达 式 重复 发 生 次 数 

为 应 用 程序 预 留 的 实时 信号 的 最 大 个 数 

一 个 进程 可 使 用 的 信号 量 最 大 个 数 

信号 量 的 最 大 值 

一 个 进程 可 排队 信号 的 最 大 个 数 

一 个 _Sc_ STREAM MAX 进程 在 任意 给 定时 刻 标 准 IJO 
流 的 最 大 个 数 。 如 果 定 义 ， 必 须 与 FOPEN_MAX 有 相同 值 

在 解析 路 径 名 时 ， 可 遍历 的 符号 链接 数 

每 个 进程 的 最 大 定时 器 个 数 

终端 设备 名 长 度 ， 包 括 终止 null 字 节 

时 区 名 中 的 最 大 字 节 数 


图 2-11 对 sysconf 的 限制 及 name 参 数 


.SC DELAYTIMER MAX 
SC HOST NAME MAX 
.SC IOV MAX 


.SC LINE MAX 

SC LOGIN NAME MAX 
.SC NGROUPS MAX 
SC OPEN MAX 

.SC PAGESIZE 

.SC PAGE SIZE 
.SC RE DUP MAX 


.SC RTSIG MAX 

SC SEM NSEMS MAX 
.SC SEM VALUE MAX 
SC SIGQUEUE MAX 
—SC. STREAM MAX 


.SC SYMLOOP MAX 
.SC TIMER MAX 
.SC TTY NAME MAX 
.SC TZNAME MAX 


限制 名 name 参数 


ESIZEBITS 以 带 符号 整 型 值 表示 在 指定 目 PC_FILESIZEBITS 
录 中 允许 的 普通 文件 最 大 长 度 所 
需 的 最 小 位 (bit) 数 

LINK MAX 文件 链接 计数 的 最 大 值 _PC_LINK_MRX 

MAX CANON 终端 规范 输入 队列 的 最 大 字 节 数 | PC MAX CANON 

MAX_INPUT 终端 输入 队列 可 用 空间 的 字 节 数 | _PC_MAX_INPUT 


NAME MAX 文件 名 的 最 大 字 节 数 〈 不 包括 | PC NAME MAX 
终止 null 字 节 ) 

PATH MAX 相对 路 径 名 的 最 大 字 节 数 ， 包 | PC PATH MAX 
括 终止 null 字 节 

PIPE BUF 能 原子 地 写 到 管道 的 最 大 字 节 数 | PC PIPE BUF 

_POSIX TIMESTAMP RESOLUTION 文件 时 间 惟 的 纳 秒 精度 PC TIMESTAMP RESOLUTION 

SYMLINK MAX 符号 链接 的 字 节 数 PC SYMLINK MAX 


图 2-12 对 pathconf 和 fpathconf 的 限制 及 name 参 数 


(3) _SC_CLK_TCK 的 返回 值 是 每 秒 的 时 钟 滴答 数 ， 用 于 times 画 

ARI (8.1777) ° 
对 于 pathconf 的 参数 pathname 和 fpathconf 的 参数 fd 有 很 多 限制 。 如 

果 不 满足 其 中 任何 一 个 限制 ， 则 结果 是 未 定义 的 。 

(1) PC MAX CANON 和 _PC_MAX_INPUT3 引 用 的 文件 必须 是 
终端 文件 。 

(2) PC LINK MAX 和 _PC_TIMESTAMP_RESOLUTION 引用 
的 文件 可 以 是 文件 或 目录 。 如 果 是 目录 ， 则 返回 值 用 于 目录 本 身 ， 而 
不 用 于 目录 内 的 文件 名 项 。 

(3) _PC_FILESIZEBITS 和 _PC_NAME_MAX3 引 用 的 文件 必须 是 
目录 ， 返 回 值 用 于 该 目录 中 的 文件 名 。 

(4) PC PATH _ MAX 引用 的 文件 必须 是 目 孙 。 当 所 指定 的 目录 
是 工作 目录 时 ， 返 回 值 是 相对 路 径 名 的 最 大 长 度 (遗憾 的 是 ， 这 不 是 
我 们 想 要 知道 的 一 个 绝对 路 径 名 的 实际 最 大 长 度 ， 我 们 将 在 2.5.5 节 中 
再 次 回 到 这 一 问题 上 来 ) 。 

(5) _PC_PIPE_BUF3 引 用 的 文件 必须 是 管道 、FIFO 或 目录 。 在 管 
道 或 FIFO 情 况 下 ， 返 回 值 是 对 所 引用 的 管道 或 FIFO 的 限制 值 。 对 于 目 


录 ， 返 回 值 是 对 在 该 目录 中 创建 的 任 一 FIFO 的 限制 值 。 
(6) _PC_SYMLINK_MAX 引 用 的 文件 必须 是 目录 。 返 回 值 是 该 
目录 中 符号 链接 可 包含 字符 串 的 最 大 长 上 度 。 


实例 


图 2-13 中 所 示 的 awk(1) 程 序 构建 了 一 个 C 程 序 ， 它 打印 各 pathconf 和 
sysconf 符 号 的 值 。 


#!/usr/bin/awk -f 


BEGIN { 
princtf(" 
pruint£f(" 
pruaintf(" 
printf(" 
printf(" 
prinvt( 
PEIE" 
printf(" 


#include \"apue.h\"\n") 

#include <errno.h>\n") 

#include <limits.h>\n") 

\n") 

static void pr_sysconf(char *, int);\n") 

static void pr pathconf(char *, char *, int);\n") 
NI") 

int\n") 


printf ("main(int argc, char *argv[]) n") 
printf("(Mn") 
printf("\tif (argc != 2)\n") 
printf ("\t\terr_quit(\"usage: a.out <dirname>\");\n\n") 
FS="\tt+" 
while (getline <"sysconf.sym" > 0) { 
printf ("#ifdef %s\n", $1) 
printf ("\tprintf(\"%s defined to be %%ld\\n\", (long) %s+0);\n", $1, $1) 
printf ("#else\n") 
printf ("\tprintf(\"no symbol for %s\\n\");\n", $1) 
printf ("#endif\n") 
printf ("ifdef %s\n", $2) 
printf ("\tpr_sysconf(\"%s =\", %s);\n", $1, $2) 
printf ("#else\n") 
printf ("\tprintf(\"no symbol for %s\\n\");\n", $2) 
printf ("#endif\n") 
} 
close ("sysconf.sym") 
while (getline <"pathconf.sym" > 0) { 
printf ("#ifdef %s\n", $1) 
printf ("\tprintf(\"%s defined to be %%ld\\n\", (long) %s+0);\n", $1, $1) 
printf ("#else\n") 
printf ("\tprintf(\"no symbol for %s\\n\");\n", $1) 
printf ("#endif\n") 
printf ("#ifdef %s\n", $2) 
printf ("\tpr_pathconf(\"%s =\", argv[1], %s);\n", $1, $2) 
printf ("#else\n") 
printf ("\tprintf£(\"no symbol for %s\\n\");\n", $2) 
printf ("#endif\n") 


close ("pathconf.sym") 
exit 


END { 
printf ("\texit (0); Nn") 
printf ("}\n\n") 
printf ("static void\n") 
printf ("pr sysconf(char *mesg, int name) \n") 
printe tAn} 
printf ("\tlong val; M nWMn") 
printf ("\tfputs (mesg, stdout) ;\n") 
printf("\terrno = 0;\n") 
printf("\tif ((val = sysconf(name)) < 0) {\n"} 
printf("\t\tif (errno != 0) {\n"} 
printf("\t\t\tif (errno == EINVAL) \n") 
printf ("\t\t\t\tfputs(\" (not supported) \\n\", stdout) ;\n") 
printf ("\t\t\telse\n") 
printf ("\t\t\t\terr_sys(\"sysconf error\");\n") 
printf("\t\t) else {\n"} 
printf£("\t\t\tfputs(\" (no limit) \\n\", stdout) ;\n") 
printf ("\t\t) Nn") 
printf("\t} else {\n"} 
printf ("\t\tprintf(\" %3ld\\n\", val); Mn") 
printf ("\t) Mn") 


printf ("j]MnMn") 

printf("static void\n") 

printf("pr pathconf(char *mesg, char *path, int name) n") 
printf ("(Nn") 

printf("Ntlong val; Mn") 

peintf("Nn^) 

printf ("\tfputs (mesg, stdout) ;\n") 

printf("\terrno = 0;\n") 

printf("\tif ((val = pathconf(path, name)) < 0) {\n"} 
printf("NtNtif (errno != 0) {\n"} 

printf("\t\t\tif (errno == EINVAL) \n") 

printf ("\t\t\t\tfputs(\" (not supported) \\n\", stdout) ;\n") 
printf ("\t\t\telse\n") 

printf ("\t\t\t\terr_ sys(\"pathconf error, path = %%s\", path);\n") 
printf("NtNt) else {\n"} 

printf("NtNtNtfputs(N" (no limit)NWMnN", stdout) ;\n") 
printf("NtNt) \n") 

printf("\t) else {\n"} 

printf ("\t\tprintf(\" $$ld\\n\", val);\n") 

printf ("Nt) Nn") 

printf (")Mn") 


图 2-13 构建 C 程 序 以 打印 所 有 得 到 支持 的 系统 配置 限制 


该 awk 程序 读 两 个 输入 文件 一 一 pathconf.sym 和 sysconfig.sym， 这 两 
个 文件 中 包公 了 用 制 表 符 分 隔 的 限制 名 和 符号 列表 。 并 非 每 种 平台 都 
定义 所 有 符号 ， 所 以 围绕 每 个 pathconf 和 sysconf 调 用 ，awk 程 序 都 使 用 
了 必要 的 大 fdef 语 句 。 
例如 ，awk 程 序 将 输入 文件 中 类 似 于 下 列 形式 的 行 : 
NAME MAX PC NAME MAX 
转换 成 下 列 C 代 三: 
#ifdef NAME MAX 
printf("NAME MAX is defined to be %d\n", NAME MAX-0); 
#else 
printf("no symbol for NAME_MAX\n"); 
#endif 
#ifdef PC_NAME MAX 
pr. pathconf('NAME MAX =", argv[1], PC NAME MAX); 


#else 
printf("no symbol for _PC_NAME_MAX\n"); 
#endif 
由 awk 产 生 的 C 程 序 如 图 2-14 所 示 ， 它 会 打印 所 有 这 些 限制 ， 并 处 
理 未 定义 限制 的 情况 。 


#include "apue.h" 


#include «errno.h» 
#include «limits.h» 


Static void pr sysconf(char *, int); 
static void pr pathconf(char *, char *, int); 
int 


main(int argc, char *argv[]) 


if (argc != 2) 
err quit("usage: a.out <dirname>") ; 


#ifdef ARG MAX 
printf ("ARG MAX defined to be %ld\n", (long)ARG MAX*0); 
#else 
printf("no symbol for ARG MAX\n"); 
#endif 
#ifdef SC ARG MAX 
pr sysconf("ARG MAX =", SC ARG MAX); 
#else 
printf("no symbol for _SC_ARG MAX\n"); 
fendif 


/* similar processing for all the rest of the sysconf symbols... */ 


#ifdef MAX CANON 
printf("MAX CANON defined to be @ld\n", (long)MAX CANON*0); 
#else 
printf("no symbol for MAX CANON\n"); 
#endif 
#ifdef _PC_MAX CANON 
pr_pathconf ("MAX CANON =", argv[1], PC MAX CANON); 
#telse 
printf("no symbol for PC MAX _CANON\n"); 
#endif 


/* similar processing for all the rest of the pathconf symbols... 


exit (0); 


static void 
pr_sysconf(char *mesg, int name) 
{ 

long val; 


fputs(mesg, stdout); 
errno = 0; 


if ((val = sysconf(name)) < 0) { 
if (errno != 0) { 
if (errno == EINVAL) 
fputs(" (not supported) Wn", stdout); 
else 


err sys("sysconf error"); 
) else ( 
fputs(" (no limit)Nn", stdout); 
} 
} else { 
printf(" $1dWMn", val); 


static void 


RÀ 


pr pathconf(char *mesg, char *path, int name) 
( 
long val; 


fputs (mesg, stdout); 
errno = 0; 


if ((val = pathconf(path, name)) < 0) { 


if (errno != 0) { 
if (errno == EINVAL) 
fputs(" (not supported) \n", stdout); 
else 
err sys("pathconf error, path = $s", path); 
} else { 
fputs(" (no limit) \n", stdout); 
} 
} else { 


printf(" $1dWMn", val); 
} 


图 2-14 打印 所 有 可 能 的 sysconf 和 pathconf 值 

图 2-15 总 结 了 在 本 书 讨论 的 4 种 系统 上 图 2-14 所 示 程 序 的 输出 结 
果 。“ 无 符号 ?项 表示 该 系统 没有 提供 相应 _SC 或 _ PC 符号 以 碍 询 相关 党 
量 什 。 因 此 ， 该 限制 是 未 定义 的 。 与 此 对 比 ,“ 不 文 持 ” 项 表示 该 符号 
由 系统 定义 ， 但 是 未 被 sysconf 和 pathcon 函 数 识 别 。“ 无 限制 ?项 表示 该 
系统 将 相 天 常量 定义 为 无 限制 ， 但 并 不 表示 该 限制 值 可 以 是 无 限 的 ， 
它 只 表示 该 限制 值 不 确定 。 


Solaris 10 
限制 FreeBSD 8.0 | Linux 3.2.0 ies T X 
igi UFS 文件 系统 | PCFS 文件 系统 


ARG MAX 262 144 2 097 152 262 144 2 096 640 2 096 640 
ATEXIT_MAX 32 | 2 147 483 647 2 147 483 647 无 限制 无 限制 
CHARCLASS NAME MAX 无 符号 2 048 14 14 14 
CHILD MAX 1 760 47 211 8021 8 021 
时 钟 滴答 / 秒 128 100 100 100 
COLL WEIGHTS MAX 10 10 
FILESIZEBITS 41 不 支持 
HOST NAME MAX 255 
IOV MAX 16 16 
LINE MAX 2 048 
LINK MAX 

LOGIN NAME MAX 

MAX CANON 

MAX INPUT 

NAME MAX 

NGROUPS MAX 

OPEN MAX 

PAGESIZE 

PAGE SIZE 

PATH MAX 

PIPE BUF 

RE DUP MAX 

STREAM MAX 


SYMLINK MAX 
SYMLOOP MAX 
TTY NAME MAX 
TZNAME MAX 


无 限制 
无 限制 
32 
6 


1 024 
20 

128 
无 限制 


1 024 
20 

128 
无 限制 


图 2-15 配置 限制 的 实例 


注意 ， 有 些 限制 报告 地 并 不 正确 。 例 如 ， 在 Linux 中 ， 
SYMLOOP on (HX EE URSUS AI, Seb 
上 它 在 人 硬 编码 中 有 限制 值 ， 这 一 限制 将 循环 缺失 的 情况 下 遍历 连续 符 
号 链接 的 数目 限制 为 40 ( 参 w fs/namei.c'F BJfollow linkÉgZX) 。 

Linux 中 另 一 个 潜在 的 不 精确 的 来 源 是 pathconf 和 fpathconf 函 数 都 是 
在 C 库 函数 中 实现 的 ， 这 些 函 数 返回 的 配置 限制 依赖 于 底层 的 文件 系统 


JEAN, RUN ER RACE AAEM CERO, ER BOR BIB AE — 1-3 
测 值 。 

我 们 将 在 4.14 节 中 看 到 ，UFS 是 Berkeley 快 速 文件 系统 的 SVR4 实 
现 ，PCFS 是 Solaris 的 MS-DOS FAT 文 件 系 统 的 实现 。 


2.5.5 不 确定 的 运行 时 限制 


前 面 已 提 及 某 些 限制 值 可 能 是 不 确定 的 。 我 们 遇 到 的 问题 是 ， 如 
果 这 些 限 制 值 没 有 在 头 文件 <limits.h> 中 定义 ， 那 么 在 编译 时 也 就 不 能 
使 用 它们 。 但 是 ， 如 果 它 们 的 值 是 不 确定 的 ， 那 么 在 运行 时 它们 可 能 
也 是 未 定义 的 。 让 我 们 来 观察 两 个 特殊 的 情况 ， 为 一 个 路 径 名 分 配 存 
储 区 ， 以 及 确定 文件 描述 符 的 数目 。 

1. 路 径 名 

很 多 程序 需要 为 路 径 名 分 配 存 储 区 ， 一 般 来 说 ， 在 编译 时 就 为 其 
分 配 了 存储 区 ， 而 且 不 同 的 程序 使 用 各 种 不 同 的 幻 数 (其 中 很 少 是 正 
确 的 ) 作为 数组 长 度 ， 如 256、512、1 024 或 标准 WO 常量 BUFSIZ © 
4.3BSD X XC fF «sys/param.h» FP HJ fi St MAXPATHLEN 才 是 正确 的 值 ， 
但 是 很 多 4.3BSD 应 用 程序 并 未 使 用 它 。 

POSIX.1 试 图 用 PATH_MAX 值 来 帮助 我 们 ， 但 是 如 果 此 值 是 不 确定 
的 ， 那 么 仍 是 训 无 帮助 的 。 图 2-16 程 序 是 本 书 用 来 为 路 径 名 动态 分 配 存 
储 区 的 函数 。 


#include "apue.h" 
#include «errno.h» 
#include «limits.h» 


#ifdef PATH MAX 

static long pathmax - PATH MAX; 
felse 

Static long pathmax 
#endif 


li 
© 
`~ 


static long posix version = 0; 
static long xsi version - 0; 


/* If PATH MAX is indeterminate, no guarantee this is adequate */ 
#define PATH MAX GUESS 1024 


char * 
path alloc(size t *sizep) /* also return allocated size, if nonnull */ 


char Rotor 


size t size; 


if (posix version == 0) 
posix version = sysconf( SC VERSION); 


if (xsi version == 0) 
xsi version - sysconf( SC XOPEN VERSION); 


if (pathmax == 0) { /* first time through */ 
errno = 0; 
if ((pathmax = pathconf("/", PC PATH MAX)) < 0) { 
if (errno == 0) 


pathmax = PATH MAX GUESS; /* it's indeterminate */ 
else 
err sys("pathconf error for PC PATH MAX"); 
) else ( 
pathmaxt+; /* add one since it's relative to root */ 
} 
} 


/* 
* Before POSIX.1-2001, we aren't guaranteed that PATH MAX includes 
* the terminating null byte. Same goes for XPG3. 
Ay 
if ((posix version « 200112L) && (xsi version « 4)) 
size = pathmax + 1; 
else 


size = pathmax; 


if ((ptr = malloc(size)) == NULL) 
err sys("malloc error for pathname"); 


if (sizep !- NULL) 
*sizep = size; 
return(ptr); 


图 2-16 为 路 人 径 名 动态 地 分 配 空 间 

如 果 <limits.h> 中 定义 了 常量 PATH_MAX， 那 么 就 没有 任何 问题 : 
如 果 未 定义 ， 则 需 调 用 pathconf。 因 为 pathconf 的 返回 值 是 基于 工作 目 
录 的 相对 路 径 名 的 最 大 长 度 ， 而 工作 目录 是 其 第 一 个 参数 ， 所 以 ， 指 
定 根 目录 为 第 一 个 参数 ， 并 将 得 到 的 返回 值 加 1 作为 结果 值 。 如 果 
pathconffs4#4PATH_ MAX MAREN), ALAR SABES MEME ° 

对 于 PATH_MAX 是 否 考 虑 到 在 路 径 名 末尾 有 一 个 null B 3x — 
点 ，2001 年 以 前 的 POSIX.1 版 本 表述 得 并 不 清楚 。 出 于 安全 方面 的 考 


虚 ， 如 果 操 作 系 统 的 实现 符合 某 个 先前 版 本 的 标准 ， 但 并 不 符合 Single 
UNIX Specification 的 任何 版 本 (SUS 明 确 要 求 在 结尾 处 加 一 个 终止 null 
字 节 ) ， 则 需要 在 为 路 径 名 分 配 的 存储 量 上 加 1。 

处 理 不 确定 结果 情况 的 正确 方法 与 如 何 使 用 分 配 的 存储 空间 有 
天 。 例 如 ， 如 果 我 们 为 getcewd 调 用 分 配 存储 空间 (返回 当前 工作 目录 
的 绝对 路 径 名 ， 见 4.23 节 ) ， 但 分 配 到 的 空间 太 小 ， 则 会 返回 一 个 错 
误 ， 并 将 ermo 设 置 为 ERANGE。 然 后 可 调用 realloc 来 增加 分 配 的 空间 

( 见 7.8 节 和 习题 4.16) 并 重 试 。 不 断 重复 此 操作 ， 直 到 getcwd 调 用 成 

功 执行 。 

2. 最 大 打开 文件 数 

守护 进程 (daemon process， 在 后 台 运 行 且 不 与 终端 相连 接 的 一 种 
进程 ) 中 一 个 常见 的 代码 序列 是 关闭 所 有 打开 文件 。 某 些 程序 中 有 下 
列 形式 的 代码 序列 ， 这 上 段 程序 假定 在 <sys/param.h> 头 文件 中 定义 了 党 
量 NOFILE 。 

#include <sys/param.h>; 

for (i = 0; i < NOFILE; i++) 

close(i); 

另外 一 些 程序 则 使 用 某 些 <stdio.h> 版 本 提供 的 作为 上 限 的 常量 
_NFILE。 某 些 程序 则 直接 将 其 上 限 值 硬 编码 为 20。 但 是 ， 这 些 方法 都 
不 是 可 移植 的 。 

我 们 希望 用 POSIX.1 的 OPEN_MAX 确 定 此 值 以 提高 可 移植 性 ， 但 
是 如 末 此 值 是 不 确定 的 ， 则 仍然 有 问题 ， 如 果 我 们 编写 下 列 代码 : 

#include <unistd.h> 

for (i = 0; i < sysconf( SC OPEN MAX); i++) 

close(i); 

AIAOPEN MAX EH), JPAforS NIB RAPUIT. WN 

sysconf fix [E]-1 » AAMEN P, RATER OPE WE A HI PUB T XUN EL 


至 某 个 限制 值 (如 256) 。 如 同上 面 的 路 径 名 实例 一 样 ， 虽 然 并 不 能 保 
证 在 所 有 情况 下 都 能 正确 工作 ， 但 这 却 是 我 们 所 能 选择 的 最 好 方法 。 
图 2-17 的 程序 中 使 用 了 这 种 技术 。 

我 们 可 以 耐心 地 调用 close， 直 至 得 到 一 个 出 错 返 回 ， 但 是 从 cose 
(EBADF) 出 错 返 回 并 不 区 分 无 效 描 述 符 和 没有 打开 的 描述 符 。 如 果 
使 用 此 技术 ， 而 且 描 述 符 9 未 打开 ， 描 述 符 10 打 开 了 ， 那 么 将 停止 在 9 
上 ， 而 不 会 关闭 10。dup 画 数 (753.1255) 在 超过 了 OPEN_MAX 时 确实 
会 返回 一 个 特定 的 出 错 值 ， 但 是 用 复制 一 个 描述 符 两 、 三 百 次 的 方法 
来 确定 此 值 是 一 种 非常 极端 的 方法 。 


#include "apue.h" 
#include «errno.h» 
#include <limits.h> 


#ifdef OPEN MAX 

static long openmax = OPEN MAX; 
#else 

static long openmax = 0; 

#endif 


/* 

* If OPEN MAX is indeterminate, this might be inadequate. 
ir 

#define OPEN MAX GUESS 256 


long 
open_max (void) 
{ 
if (openmax == 0) { /* first time through */ 
errno = 0; 


if ((openmax = sysconf( SC OPEN MAX)) < 0) { 
if (errno == 0) 
openmax = OPEN MAX GUESS; /* it's indeterminate */ 
else 
err sys("sysconf error for SC OPEN MAX"); 
} 
} 


return (openmax) ; 


图 2-17 确定 文件 描述 符 个 数 

某 些 实现 返回 LONG. MAX 作为 限制 什 ， 但 这 与 不 限制 其 值 在 歼 
果 上 是 相同 的 。Linux 对 ATEXIT_MAX 所 取 的 限制 值 就 属于 此 种 情况 

( 见 图 2-15) ， 这 将 使 程序 的 运行 行为 变 得 非常 糟糕 ， 因 此 并 不 是 一 个 

好 方 读 * 

例如 ， 我 们 可 以 使 用 Bourne-again shell 的 内 建 命令 ulimit 来 更 改进 
程 可 同时 打开 文件 的 最 多 个 数 。 如 果 要 将 此 限制 值 设置 为 在 效果 上 是 
无 限制 的 ， 那 么 通常 要 求 具 有 特权 (超级 用 户 ) 。 但 是 ， 一 旦 将 其 值 
设置 为 无 穷 大 ，sysconf 就 会 将 LONG_MAX 作 为 OPEN_MAX 的 限制 值 
报告 。 程 序 若 将 此 值 作为 要 关闭 的 文件 描述 符 数 的 上 限 (如 图 2-17 所 
示 ) ， 那 么 为 了 试图 关闭 2 147 483 647 个 文件 描述 符 ， 就 会 浪费 大 量 时 
间 ， 实 际 上 其 中 绝 大 多 数 文件 描述 符 并 未 得 到 使 用 。 

支持 Single UNIX Specification 中 XSI 扩 展 的 系统 提供 了 getrlimit(2) 
函数 〈 见 7.11 节 ) 。 它 返回 一 个 进程 可 以 同时 打开 的 描述 符 的 最 多 个 
数 。 使 用 该 函数 ， 我 们 能 够 检测 出 对 于 进程 能 够 打开 的 文件 数 实际 上 
并 没有 设置 上 限 ， 于 是 也 就 避 开 了 这 个 问题 。 

OPEN_MAX 被 POSIX 称 为 运行 时 不 变 值 ， 这 意味 着 在 一 个 进程 的 
生命 周期 中 其 值 不 应 发 生变 化 。 但 是 在 支持 XSI 扩 展 的 系统 上 ， 可 以 调 
用 setrlimit(2) 函 数 (017.115). 更 改 一 个 运行 进程 的 OPEN_MAX 值 (也 
可 用 C shell 的 limit 或 Bourne shell ` Bourne-again shell ^ Debian Almquist 
和 Korn shell 的 ulimit 命 令 更 改 这 个 值 ，。 如 果 系 统 支 持 这 种 功能 ， 则 可 
以 更 改 图 2-17 中 的 函数 ， 使 得 每 次 调用 此 函数 时 都 会 调用 sysconf， 而 
不 只 是 在 第 一 次 调用 此 函数 时 调用 sysconf 。 


2.6 选项 


图 2-5 列 出 了 POSIX.1 的 选项 ， 并 且 2.2.3 节 讨论 了 XSI 的 选项 组 。 如 
采 我 们 要 编写 可 移植 的 应 用 程序 ， 而 这 些 程序 可 能 会 依赖 于 这 些 可 选 
的 支持 的 功能 ， 那 么 就 需要 一 种 可 移植 的 方法 来 判断 实现 是 否 支 持 一 
个 给 定 的 选项 。 
如 同 对 限制 的 处 理 (012.55) 一 样 ，POSIX.1 定 义 了 3 种 处 理 选项 
的 方法 。 
(1) 编译 时 选项 定义 在 <unistd.h> 中 。 
(2) 与 文件 或 目录 无 关 的 运行 时 选项 用 sysconf 函 数 来 判断 。 
(3) 与 文件 或 目录 有 关 的 运行 时 选项 通过 调用 pathconf 或 fpathconf 
选项 包括 了 图 2-5 中 第 3 列 的 符号 以 及 图 2-19 和 图 2-18 中 的 符号 。 如 
果 符 号 常量 未 定义 ， 则 必须 使 用 sysconf、pathconf 或 fpathconf 来 判断 是 
否 支 持 该 选项 。 在 这 种 情况 下 ， 这 些 函 数 的 name 参 数 前 级 _POSIX 必 须 
蔡 换 为 _ SC 或 _ PC。 对 于 以 _XOPEN 为 前 级 的 常量 ， 在 构成 hame 参 数 时 
A UEBER SCEX PC ° fila, 45$ POSIX RAW THREADS 
RELAI, ABA RAT ELT fname2 Zi EEJSC RAW. THREADS, # D 
HE Yal FA sysconf 2E JH] Wt AF S zie ds X IF POSIX FE AT WA mE 
 XOPEN UNIX ZÉ 2k 4E MEN, JEA mt n] DA f name 2: Mix BN 
_SC_XOPEN_UNIX， 并 以 此 调用 sysconf 来 判断 该 平台 是 否 支 持 XSI 扩 
E o 
对 于 每 一 个 选项 ， 有 以 下 3 种 可 能 的 平台 支持 状态 。 
(3) 如 果 符 号 常量 没有 定义 或 者 定义 值 为 -1， 那 么 该 平台 在 编译 
时 并 不 文 持 相应 选项 。 但 是 有 一 种 可 能 ， 即 在 已 文 持 该 选项 的 新 系统 
上 运行 老 的 应 用 时 ， 即 使 该 选项 在 应 用 编译 时 未 被 文 持 ， 但 如 今 新 系 
统 运行 时 检查 会 显示 该 选项 已 被 支持 。 
(2) 如 果 符 号 常量 的 定义 值 大 于 0， 那 么 该 平台 支持 相应 选项 。 


(3) 如 果 符 号 常 


它们 的 符号 常量 。 


EZ 


Za I 


主意 ， 我 们 省 略 了 与 实用 命令 


了 其 他 一 


Ai VA, PY Ex, 


T zr. 
些 sysconf 使 用 的 未 弃 用 的 选项 及 
相关 的 选项 。 


量 的 定义 值 为 0， 则 必须 调用 sysconf、pathconf 或 
fpathconf 来 判断 相应 选项 是 否 受 到 文 持 。 

图 2-18 总 结 了 pathconf 和 fpathconf 使 用 的 
iub NEM 


除了 图 2-5 中 列 


POSIX CHOWN RESTRICTED 
POSIX NO TRUNC 
POSIX VDISABLE 


. POSIX ASYNC IO 
POSIX PRIO IO 

. POSIX SYNC IO 

. POSIX2 SYMLINKS 


使 用 chown 是 否 
路 径 名 长 于 NAME_MAX 是 否 出 错 
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图 2-18 pathconf 和 fpathconf 的 选项 及 name 人 参数 
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POSIX MAPPED FILES 


POSIX MEMORY PROTECTION 
POSIX READER WRITER LOCKS 
POSIX REALTIME SIGNALS 


POSIX SAVED IDS 


POSIX SEMAPHORES 

POSIX SHELL 
POSIX SPIN LOCKS 

POSIX THREAD SAFE FUNCTIONS 
POSIX THREADS 


POSIX TIMEOUTS 


POSIX TIMERS 
POSIX VERSION 


 XOPEN CRYPT 


此 实现 是 否 支持 POSIX 异步 IJO 
此 实现 是 否 支 持 屏障 
此 实现 是 否 支 持 时 钟 选择 
此 实现 是 否 支持 作业 控制 
此 实现 是 否 支 持 存储 映像 文件 
此 实现 是 否 支 持 存 储 保护 
此 实现 是 否 支 持 读者 - 写 者 锁 
此 实现 是 否 支 持 实 时 信号 
此 实现 是 否 支持 保存 的 设置 
用 户 ID 和 保存 的 设置 组 ID 


此 实现 是 否 支 持 POSIX 信号 量 
此 实现 是 否 支 持 POSIX shell 

此 实现 是 否 支 持 旋 转 锁 

此 实现 是 否 支 持 线程 安全 函数 


此 实现 是 否 支持 线程 

此 实现 是 否 支持 基于 超时 的 
变量 选择 函数 

此 实现 是 否 支 持 定时 器 
POSIX.1 版 本 


此 实现 是 否 支 持 XSI 加 密 可 
选 组 


.SC ASYNCHRONOUS IO 
.SC BARRIERS 

.SC CLOCK SELECTION 
.SC JOB CONTROL 

.SC MAPPED FILES 

SC MEMORY PROTECTION 
SC READER WRITER LOCKS 
SC REALTIME SIGNALS 


SC SAVED IDS 


SC SEMAPHORES 

.SC SHELL 

SC SPIN LOCKS 

SC THREAD SAFE FUNCTIONS 
SC THREADS 


.SC TIMEOUTS 


SC TIMERS 
.SC VERSION 


.SC XOPEN CRYPT 


此 实现 是 否 支持 XSI 实时 选 
项 组 

此 实现 是 否 支持 实时 线程 选 
项 组 

此 实现 是 否 支 持 XSI 共享 存 
储 选 项 组 


_XOPEN_REALTIME 


_SC_XOPEN_REALTIME 


XOPEN REALTIME THREADS 


SC XOPEN REALTIME THREADS 


_XOPEN_SHM _SC_XOPEN_SHM 


XOPEN_VERSION XSI 版 本 SC XOPEN VERSION 


图 2-19 sysconf 的 选项 及 name 参 数 


如 同系 统 限 制 一 样 ， 关 于 sysconf、pathconf 和 fpathconf 如 何 处 理 选 
项 ， 有 如 下 几 点 值得 注意 。 

(1) _SC_VERSION 的 返回 值 表示 标准 发 布 的 年 (以 4 位 数 表 
zm) `H 〈 以 2 位 数 表示 ) 。 该 值 可 能 是 198808L + 199009L 、199506L 
或 表示 该 标准 后 续 版 本 的 其 他 值 。 与 SUSv3 (POSIX.1 2001 年 版 ) 相 
关连 的 值 是 200112L， 与 SUSv4 (POSIX.1 2008 年 版 ) 相 关连 的 值 是 
200809L ° 

(2) _SC_XOPEN_VERSION 的 返回 值 表示 系统 支持 的 XSI 版 本 。 
与 SUSv3 相 关联 的 值 是 600， 与 SUSv4 相 关 的 值 是 700 © 

( 3 ) _SC_JOB CONTROL ` _SC SAVED IDS 以 X 
_PC_VDISABLE 的 值 不 再 表示 可 选 功能 。 虽 然 XPG4 和 SUS 早 期 版 本 要 
求 支持 这 些 选项 ， 但 从 SUSv3 起 ， 不 再 需要 这 些 功能 ， 但 这 些 符号 仍然 
被 保留 ， 以 便 向 后 兼容 。 

(4) 符合 POSIX.1-2008 的 平台 还 要 求 支 持 下 列 选 项 : 

* POSIX. ASYNCHRONOUS IO 

* POSIX BARRIERS 

* POSIX. CLOCK SELECTION 

* POSIX MAPPED FILES 

* POSIX MEMORY. PROTECTION 

* POSIX. READER. WRITER LOCKS 
* POSIX. REALTIME SIGNALS 


* POSIX. SEMAPHORES 
* POSIX. SPIN LOCKS 
* POSIX THREAD SAFE FUNCTIONS 
* POSIX THREADS 
* POSIX. TIMEOUTS 
* POSIX TIMERS 
这 些 常量 定义 成 具有 值 200809L。 相 应 的 _SC 符 号 同样 是 为 了 向 后 
兼容 而 被 保留 下 来 的 。 
(5) 如 果 对 指定 的 pathname 或 fd 已 不 再 支持 此 功能 ， 那 么 
PC CHOWN RESTRICTED 7l PC NO TRUNC3jE [H| -1, Tfj errno P^ 
变 ， 在 所 有 符合 POSIX 的 系统 中 ， 返 回 值 将 大 于 0 (表示 该 选项 被 文 
持 ) ; 
(6) _PC_CHOWN_RESTRICT3 引 用 的 文件 必须 是 一 个 文件 或 者 是 
一 个 目录 。 如 果 是 一 个 目录 ， 那 么 返回 值 指明 该 选项 是 否 可 应 用 于 该 
目录 中 的 各 个 文件 。 
(7) _PC_NO_TRUNC 和 _PC_2_SYMLINKS3 引 用 的 文件 必须 是 一 
个 目录 。 
(8) _PC_NO_TRUNC 的 返回 值 可 用 于 目录 中 的 各 个 文件 名 。 
(9) _PC_VDISABLE 引 用 的 文件 必须 是 一 个 终端 文件 。 
(10) _PC_ASYNC_IO、_PC_PRIO_IO 和 _PC_SYNC _IO 引 用 的 文 
件 一 定 不 能 是 一 个 目录 。 
图 2-20 列 出 了 若干 配置 选项 以 及 在 本 书 所 讨论 的 4 个 示例 系统 上 的 
对 应 值 。 如 果 系 统 定义 了 某 个 符号 常量 但 它 的 值 为 -1 或 90， 但 是 相应 的 
sysconf 或 pathconf 调 用 返回 的 是 -1， 就 表示 该 项 未 个 文 持 。 可 以 看 到 ， 
有 些 系统 实现 还 没有 跟 上 Single UNIX Specification 的 最 新 版 本 。 


FreeBSD Solaris 10 


8.0 


UFS 文件 系统 | PCES 文件 系统 


POSIX CHOWN RESTRICTED 200112 
POSIX NO TRUNC 200112 不 支持 
POSIX SAVED IDS 不 支持 200112 l 
POSIX_THREADS 200112 200809 200112 200112 
POSIX_VDISABLE 255 0 255 0 

_POSIX_VERSION 200112 200809 200112 200112 200112 

_XOPEN_UNIX 不 支持 1 1 l 1 

 XOPEN VERSION 不 支持 700 600 600 600 


l 

_POSIX_JOB_CONTROL 1 200112 1 
l 
l 


图 2-20 配置 选项 的 实例 

注意 ， 当 用 于 Solaris PCFS 文 件 系统 中 的 文件 时 ， 对 于 
_PC_NO_TRUNC，Ppathconf 返 回 -1。PCFS 文 件 系统 支持 DOS 格 式 (EK 
盘 格 式 ) ，DOS 文 件 名 按 DOS 文 件 系 统 所 要 求 8.3 格 式 截 断 ， 在 进行 此 
种 操作 时 并 无 任何 提示 。 


2.7 功能 测试 宏 


如 前 所 述 ， 头 文件 定义 了 很 多 POSIX.1 和 XSI 符 号 。 但 是 除了 
POSIX.1 和 XSI 定 义 外 ， 大 多 数 实现 在 这 些 头 文件 中 也 加 入 了 它们 自己 
的 定义 。 如 果 在 编译 一 个 程序 时 ， 硕 望 它 只 与 POSIX 的 定义 相关 ， 而 
不 与 任何 实现 定义 的 常量 冲突 ， 那么 就 需要 定义 常量 
POSIX C SOURCE 。 一 旦 定义 了 _POSIX_C_SOURCE， 所 有 POSIX.1 
头 文件 都 使 用 此 常量 来 排除 任何 实现 专 有 的 定义 。 

POSIX.1 f» /E Hy BH hig AS RE X [f POSIX SOURCE 和 常量。 在 
POSIX.1872001hk P, ECE RA POSIX C SOURCE ° 

常量 POSIX C SOURCE XX XOPEN SOURCE RN ZI BE DU A E 

(feature test macro) 。 所 有 功能 测试 宏 都 以 下 划 线 开始 。 当 要 使 用 它 


们 时 ， 通 常 在 cc 命令 行 中 以 下 列 方式 定义 : 

cc-D POSIX C SOURCE-200809L file.c 

这 使 得 C 程 序 在 包括 任何 头 文件 之 前 ， 定 义 了 功能 测试 宏 。 如 果 我 
们 仅 想 使 用 POSIX.1 定 义 ， 那 么 也 可 将 源 文 件 的 第 一 行 设置 为 : 

#define_POSIX_C_SOURCE 200809L 

为 使 SUSv4 的 XSI 选 项 可 由 应 用 程序 使 用 ， 需 将 常量 
_XOPEN_SOURCE 定 义 为 700。 除 了 让 XSI 选 项 可 用 以 外 ， 束 POSIX.1 
的 功能 而 言 ， 这 与 将 _ POSIX_C_SOURCE 定 义 为 200809L 的 作用 相同 。 

SUS 将 c99 实 用 程序 定义 为 C 编 译 环境 的 接口 。 随 之 ， 就 可 以 用 如 
下 方式 编译 文件 : 

c99 -D_XOPEN_SOURCE=700 file.c —o file 

可 以 使 用 -std=c99 选 项 在 gcc 的 C 编 译 器 中 启用 1999 ISO CH Re, 40 
下 所 示 : 

gcc -D XOPEN SOURCE-700 -std=c99 file.c -o file 


2.8 基 ZI 2b 型 


历史 上 ， 某 些 UNIX 系 统 变量 已 与 某 些 C 数 据 类 型 联系 在 一 起 ， 例 
如 ,历史 上 主 、 次 设备 号 存放 在 一 个 16 位 的 短 整 型 中 ，8 位 表示 主 设备 
号 ， 另 外 8 位 表示 次 设备 号 。 但 是 ， 很 多 较 大 的 系统 需要 用 多 于 256 个 
值 来 表示 其 设备 号 ， 于 是 ， 就 需要 一 种 不 同 的 技术 。 (实际 上 ，Solaris 
用 32 位 表示 设备 号 : 14 位 用 于 主 设备 号 ，18 位 用 于 次 设备 号 。) 

头 文件 <sys/types.h> 中 定义 了 某 些 与 实现 有 关 的 数据 类 型 ， 它 们 被 
称 为 基本 系统 数据 类 型 (primitive system datatype) 。 还 有 很 多 这 种 数 
据 类 型 定义 在 其 他 头 文 件 中 。 在 头 文件 中 ， 这 些 数 据 类 型 都 是 用 C 的 


typedef 来 定义 的 。 它 们 绝 大 多 数 都 以 _t 结 尾 。 图 2-21 列 出 了 本 书 将 使 用 
的 一 些 基本 系统 数据 类 型 。 

用 这 种 方式 定义 了 这 些 数 据 类 型 后 ， 束 不 再 需要 考虑 因 系 统 不 同 
而 变化 的 程序 实现 细 市 。 在 本 书 中 涉及 这 些 数据 类 型 时 ， 我 们 会 说 明 
AMTA EBERT © 


clock t 时 钟 滴答 计数 器 (进程 时 间 ) (1.10 节 ) 

comp t 压缩 的 时 钟 滴答 CPOSIX.] AE X; 8.14 节 ) 
dev t 设备 号 〈 主 和 次 ) (4.24 节 ) 

fd set 文件 描述 符 集 14.4.1 节 ) 

fpos t 文件 位 置 (5.10 节 ) 

gid t 数值 组 ID 

ino t i 节点 编号 (414 T5) 

mode t 文件 类 型 ， 文 件 创 建 模式 〈4.5 节 ) 

nlink t 目录 项 的 链接 计数 〈4.14 节 ) 

off t 文件 长 度 和 偏 移 量 〈 带 符号 的 ) (lseek，3.6 5) 
pid t 进程 ID 和 进程 组 ID 〈 带 符号 的 ) (8.2 8109.4 节 ) 
pthread t 线程 ID (11.3 35) 

ptrdiff t 两 个 指针 相 减 的 结果 〔 带 符号 的 ) 

rlim t 资源 限制 (7.11 49) 

sig atomic t 能 原子 性 地 访问 的 数据 类 型 (10.15 节 ) 

sigset t aS (10.11 35) 

size t 对 象 〈 如 字符 串 ) 长 度 〈 不 带 符号 的 ) (3.7 节 ) 
ssize t 返回 字 节 计数 的 函数 〈 带 符号 的 ) (read. write, 3.7 节 ) 
time 七 日 历时 间 的 秒 计数 器 (1.10 节 ) 

uid t 数值 用 户 ID 

wchar t 能 表示 所 有 不 同 的 字符 码 


图 2-21 一 些 党 用 的 基本 系统 数据 类 型 


2.9 标准 之 间 的 冲突 


就 整体 而 言 ， 这 些 不 同 的 标准 之 间 配 合 得 相当 好 。 因 为 SUS 基本 
说 明和 POSIX.1 是 同一 个 东西 ， 所 以 我 们 不 对 它们 进行 特别 的 说 明 ， 
我 们 主要 关注 ISO C 标 准 和 POSIX.1 之 间 的 差别 。 它 们 之 间 的 冲突 并 非 
有 意 ， 但 如 果 出 现 冲 突 ，POSIX.1 服 从 ISO C 标 准 。 然 而 它们 之 间 还 是 
存在 着 一 些 差别 的 。 

ISO C 定 义 了 dock 琅 数 ， 它 返回 进程 使 用 的 CPU 时 间 ， 返 回 值 是 
clock_t 类 型 值 ， 但 ISO C 标准 没有 规定 它 的 单位 。 为 了 将 此 值 变换 成 以 
秒 为 单位 ， 需 要 将 其 除 以 在 <timeh> 头 文件 中 定义 的 
CLOCKS_PER_SEC。POSIX.1 定 义 了 times 函 数 ， 它 返回 其 调用 者 及 其 
所 有 终止 子 进程 的 CPU 时 间 以 及 时 钟 时 间 ， 所 有 这 些 值 都 是 clock t 类 
型 值 。sysconf 函数 用 来 获得 每 秒 滴答 数 ， 用 于 表示 times 函 数 的 返回 
值 。ISO C 和 POSIX.1 用 同一 种 数据 类 型 (clock t). 来 保存 对 时 间 的 测 
量 ， 但 定义 了 不 同 的 单位 。 这 种 差别 可 以 在 Solaris 中 看 到 ， 其 中 clock 
返回 微 秒 数 (CLOCK_PER_SEC 是 100 万 ) ， 而 sysconf 为 每 秒 滴答 数 返 
回 的 值 是 100。 因 此 ， 我 们 在 使 用 clock_t 类 型 变量 的 时 候 ， 必 须 十 分 小 
心 以 免 混 消 不 同 的 时 间 单 位 。 

男 一 个 可 能 产生 冲突 的 地 方 是 ， 在 ISO C 标 准 说 明 函 数 时 ， 可 能 没 
有 像 POSIX.1 那 样 严 。 在 POSIX 环 境 下 ， 有 些 函 数 可 能 要 求 有 一 个 与 C 
环境 下 不 同 的 实现 ， 因 为 POSIX 环 境 中 有 多 个 进程 ， 而 ISO C 环 境 则 很 
少 考 虑 宿主 操作 系统 。 尽 管 如 此 ， 很 多 符合 POSIX 的 系统 为 了 兼容 性 
也 会 实现 ISO C 函 数 。signal 芳 数 就 是 一 个 例子 。 如 果 在 不 了 解 的 情况 
下 使 用 了 Solaris 提 供 的 signal 函 数 (希望 编写 可 在 ISO C 环 境 和 较 早 
UNIX 系 统 中 运行 的 可 兼容 程序 ) ， 那 么 它 提 供 了 与 POSIX.1 sigaction 
函数 不 同 的 语义 。 第 10 章 将 对 signal 函 数 做 更 多 说 明 。 


2.10 小 结 


在 过 去 25 年 多 的 时 间 里 ，UNIX 编 程 环 境 的 标准 化 已 经 取得 了 很 大 
进展 。 本 章 对 3 个 主要 标准 一 -ISO C >` POSIX 和 Single UNIX 
Specification 进 行 了 说 明 ， 也 分 析 了 这 些 标 准 对 本 书 主 要 关注 的 4 个 实 
现 ， 即 FreeBSD、Linux、Mac OS X 和 Solaris 所 产生 的 影响 。 这 些 标准 
都 试图 定义 一 些 可 能 随 实现 而 更 改 的 参数 ， 但 是 我 们 已 经 看 到 这 些 限 
制 并 不 完美 。 本 书 将 涉及 很 多 这 些 限制 和 筷 常 量 。 

在 本 书 最 后 的 参考 书目 中 ， 说 明了 如 何 获得 这 些 标准 的 方法 。 


习题 


2.1 在 2.8 节 中 提 到 一 些 基 本 系统 数据 类 型 可 以 在 多 个 头 文 件 中 定 
义 。 例 如 ， 在 FreeBSD 8.0 中 ， size_t 在 29 个 不 同 的 头 文件 中 都 有 定义 。 
由 于 一 个 程序 可 能 包含 这 29 个 不 同 的 头 文件 ， 但 是 ISO C 却 不 允许 对 同 
一 个 名 字 进 行 多 次 typedef， 那 么 如 何 编写 这 些 头 文件 呢 ? 

2.2 检查 系统 的 头 文件 ， 列 出 实现 基本 系统 数据 类 型 所 用 到 的 实际 
数据 类 型 。 

2.3 改写 图 2-17 中 的 程序 ， 使 其 在 sysconf 为 OPEN_MAX 限 制 返回 
LONG_MAX 时 ， 避 免 进行 不 必要 的 处 理 。 


3 LO 


3.1 3| Ei 


本 章 开 始 讨论 UNIX 系 统 ， 先 说 明 可 用 的 文件 IO 函数 一 打开 文 
件 、 读 文件 、 写 文件 等 。UNIX 系 统 中 的 大 多 数 文 件 UO 只 需 用 到 5 个 画 
数 : open、read、write、lseek 以 及 close。 然 后 说 明 不 同 缓冲 长 度 对 read 
和 write 函数 的 影响 o 

本 章 朱 述 的 函数 经 常 被 称 为 不 带 缓冲 的 IO (unbuffered WO， 与 将 
在 第 5 章 中 说 明 的 标准 MO 画 数 相对 照 ) 。 术 语 不 带 缓冲 指 的 是 每 个 read 
和 write 都 调用 内 核 中 的 一 个 系统 调用 。 这 些 不 带 缓 冲 的 IO 函数 不 是 
ISO C 的 组 成 部 分 ， 但 是 ， 它 们 是 POSIX.1 和 Single UNIX Specification 
的 组 成 部 分 。 

只 要 涉及 在 多 个 进程 间 共 享 资 源 ， 原 子 操作 的 概念 就 变 得 非常 重 
要 。 我 们 将 通过 文件 1O 和 open 函 数 的 参数 来 讨论 此 概念 。 然 后 ， 本 章 
将 进一步 讨论 在 多 个 进程 间 如 何 共享 文件 ， 以 及 所 涉及 的 内 核 有 关 数 
据 结 构 。 在 描述 了 这 些 特征 后 ， 将 说 明 dup ` fentl ` sync 、fsync 和 ioctl 


3.2 yli 


对 于 内 核 而 言 ， 所 有 打开 的 文件 都 通过 文件 描述 符 引 用 。 文 件 描 
述 符 是 一 个 非 负 整数 。 当 打开 一 个 现 有 文件 或 创建 一 个 新 文件 时 ， 内 
核 向 进程 返回 一 个 文件 描述 符 。 当 读 、 写 一 个 文件 时 ， 使 用 open 或 
creat 返 回 的 文件 搬 述 符 标 识 该 文件 ， 将 其 作为 参数 传送 给 read 或 write ° 

按照 惯例 ，UNIX 系 统 shell 把 文件 描述 符 0 与 进程 的 标准 输入 关 
联 ， 文 件 描 述 符 1 与 标准 输出 关联 ， 文 件 描 述 符 2 与 标准 错误 关联 。 这 
是 各 种 shell 以 及 很 多 应 用 程序 使 用 的 惯例 ， 与 UNIX 内 核 无 关 。 尽 管 如 
此 ， 如 果 不 遵循 这 种 惯例 ， 很 多 UNIX 系 统 应 用 程序 就 不 能 正常 工作 。 

在 符合 POSIX.1 的 应 用 程序 中 ， 幻 数 0、1、2 虽 然 已 被 标准 化 ， 但 
应 当 把 它们 替换 成 符号 常量 STDIN_FILENO、STDOUT_FILENO 和 
STDERR_FILENO 以 提高 可 读 性 。 这 些 常 量 都 在 头 文件 <unistd.h> 中 定 
x. o 

文件 描述 符 的 变化 范围 是 0~~OPEN_MAX-1 ( 见 图 2-11) 。 早 期 的 
UNIX 系 统 实现 采用 的 上 限 值 是 19 (允许 每 个 进程 最 多 打开 20 个 文 
件 ) ， 但 现在 很 多 系统 将 其 上 限 值 增 加 至 63。 

对 于 FreeBSD 8.0、Linux 3.2.0、Mac OS X 10.6.8 以 及 Solaris 10, 
文件 描述 符 的 变化 范围 几乎 是 无 限 的 ， 它 只 受到 系统 配置 的 存储 器 总 
量 、 整 型 的 字 长 以 及 系统 管理 员 所 配置 的 软 限制 和 硬 限制 的 约束 。 


3.3 图 数 open 和 openat 


调用 open 或 openat 函 数 可 以 打开 或 创建 一 个 文件 。 
#include <fcntl.h> 
int open(const char *path, int oflag,... /* mode_t mode */); 


int openat(int f d, const char *path, int oflag, ... /* mode t mode */ ); 


PARANA: ARD, WIDOT, ee, eE- 


我 们 将 最 后 一 个 参数 写 为 ...，ISO C 用 这 种 方法 表明 余下 的 参数 的 
数量 及 其 类 型 是 可 变 的 。 对 于 open 函 数 而 言 ， 仅 当 创建 新 文件 时 才 使 
用 最 后 这 个 参数 ( 稍 后 将 对 此 进行 说 明 ) 。 在 函数 原型 中 将 此 参数 放 
EPS 

path 参 数 是 要 打开 或 创建 文件 的 名 字 。oflag 参 数 可 用 来 说 明 此 函数 
的 多 个 选项 。 用 下 列 一 个 或 多 个 常量 进行 “或 ?运算 构成 oflag 参 数 (这 
些 常量 在 头 文件 <fcntLh> 中 定义 ) 。 


O_RDONLY 只 读 打 开 。 
O WRONLY 只 写 打 开 。 
O RDWR ERO STF e 


KB ML BL OLRDONLY 4E 3.730, O WRONLY 4E 3.731, 
O_RDWR 定 义 为 2， 以 与 早期 的 程序 兼容 。 

O_EXEC 只 执行 打开 。 

O_SEARCH 只 搜索 打开 (应 用 于 目录 ) 。 

O_SEARCH 常 量 的 目的 在 于 在 目录 打开 时 验证 它 的 搜索 权限 。 对 
目录 的 文件 描述 符 的 后 续 操作 就 不 需要 再 次 检查 对 该 目录 的 搜索 权 
限 。 本 书 中 涉及 的 操作 系统 目前 都 没有 文 持 O_SEARCH 。 

在 这 5 个 常量 中 必须 指定 一 个 且 只 能 指定 一 个 。 下列 常量 则 是 可 选 
的 。 

O APPEND 每 次 写 时 都 追加 到 文件 的 尾 端 。3.11 市 将 详细 说 明 此 
选项 。 

O CLOEXEC 把 FD_CLOEXEC 常 量 设置 为 文件 描述 符 标 志 。3.14 
节 中 将 说 明文 件 描述 符 标 志 。 

O_CREAT 知 此 文件 不 存在 则 创建 它 。 使 用 此 选项 时 ，open 函 数 需 
同时 说 明 第 3 个 参数 mode (openat 函 数 需 说 明 第 4 个 参数 mode) ， 用 
mode 指 定 该 新 文件 的 访问 权限 位 (4.5 节 将 说 明文 件 的 权限 位 ， 那 时 就 
能 了 解 如 何 指定 mode， 以 及 如 何 用 进程 的 umask 值 修改 它 ) 。 


O DIRECTORY 如 果 path 引 用 的 不 是 目录 ， 则 出 错 。 

O EXCL 如 果 同 时 指定 了 O_CREAT， 而 文件 已 经 存在 ， 则 出 错 。 
用 此 可 以 测试 一 个 文件 是 否 存 在 ， 如 果 不 存 在 ， 则 创建 此 文件 ， 这 使 
测试 和 创建 两 者 成 为 一 个 原子 操作 。3.11 节 将 更 详细 地 说 明 原 子 操作 。 

O NOCTTY 如 采 path 引 用 的 是 终端 设备 ， 则 不 将 该 设备 分 配 作为 
此 进程 的 控制 终端 。9.6 节 将 说 明 控 制 终端 。 

O NOFOLLOW 如 果 path 引 用 的 是 一 个 符号 链 授 ， 则 出 错 。4.17 市 
将 说 明 符号 链接 。 

O NONBLOCK 如 果 path 引 用 的 是 一 个 FIFO、 一 个 块 特殊 文件 或 
一 个 字符 特殊 文件 ， 则 此 选项 为 文件 的 本 次 打开 操作 和 后 续 的 IO 操作 
设置 非 阻 塞 方式 。14.2 节 将 说 明 此 工作 模式 。 

较 早 的 System V 引 入 了 O_NDELAY (不 延迟 ) WE, CS 
O NONBLOCK (不 阻塞 ) 选项 类 似 ， 但 它 的 读 操作 返回 值 具有 二 义 
性 。 如 果 不 能 从 管道 、FIFO 或 设备 读 得 数据 ， 则 不 延迟 选项 使 read 返 
回 0， 这 与 表示 已 读 到 文件 尾 端的 返回 值 0 冲 突 。 基 于 SVR4 的 系统 仍 文 
持 这 种 语义 的 不 延迟 选项 ， 但 是 新 的 应 用 程序 应 当 使 用 不 阻塞 选项 代 
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O SYNC 使 每 次 write 等 待 物理 W/O 操作 完成 ， 包 括 由 该 
write 操作 引起 的 文件 属性 更 新 所 需 的 HO。3.14 贡 将 使 用 此 选项 。 
O_TRUNC 如 果 此 文件 存在 ， 而 且 为 只 写 或 读 -写成 功 打 


开 ， 则 将 其 长 度 截 断 为 0。 

O TTY INIT 如 有 果 打 开 一 个 还 未 打开 的 终端 设备 ， 设 置 非 标 
YE termios 参数 值 ， 使 其 符合 Single UNIX Specification。 第 18 章 将 讨论 
终端 IO 的 termios 结 构 。 

下 面 两 个 标志 也 是 可 选 的 。 它 们 是 Single UNIX Specification (以 及 
POSIX.1) 中 同步 输入 和 输出 选项 的 一 部 分 。 


O DSYNC 使 每 次 write 要 等 待 物 理 IO 操 作 完 成 ， 但 是 如 果 该 写 操 
作 并 不 影响 读 取 了 刚 写 入 的 数据 ， 则 不 需 等 竺 文件 属性 被 更 新 。 

O DSYNC 和 O SYNC 标志 有 微妙 的 区 别 。 仅 当 文 件 属性 需要 更 
新 以 反映 文件 数据 变化 (例如 ， 更 新 文件 大 小 以 反映 文件 中 包含 了 更 
多 的 数据 ) 时 ，O_DSYNC 标 志 才 影响 文件 属性 。 而 设置 0_SYNC 标 志 
后 ， 数 据 和 属性 总 是 同步 更 新 。 当 文件 用 O_DSYN 标 志 打 开 ， 在 重 写 
其 现 有 的 部 分 内 容 时 ， 文 件 时 间 属 性 不 会 同步 更 新 。 与 此 相反 ， 如 果 
文件 是 用 O_SYNC 标 志 打 开 ， 那 么 对 该 文件 的 每 一 次 write 都 将 在 write 
返回 前 更 新 文件 时 间 ， 这 与 是 否 改写 现 有 字 节 或 追加 写 文 件 无 关 。 

O_RSYNC 使 每 一 个 以 文件 描述 符 作 为 参数 进行 的 read 操 
作 等 待 ， 直 至 所 有 对 文件 同一 部 分 挂 起 的 写 操作 都 完成 。 

Solaris 10 支持 所 有 这 3 个 标志 。FreeBSD (fll MacOS X) 设置 了 
另外 一 个 标志 (O_FSYNC) ， 它 与 标志 O_SYNC 的 作用 相同 。 因 为 这 
两 个 标志 是 等 效 的 ， 它 们 定义 的 标志 具有 相同 的 值 。FreeBSD 8.0 不 文 
持 O_DSYNC 或 O_RSYNC 标 志 。Mac OS X 并 不 支持 O_RSYNC， 但 却 
定义 了 O_DSYNC， 处 理 O_DSYNC 与 处 理 O_SYNC 相 同 。Linux 3.2.0 定 
义 了 O_DSYNC， 但 处 理 O_RSYNC 与 处 理 O_SYNC 相 同 。 

由 open 和 openat 函 数 返 回 的 文件 描述 符 一 定 是 最 小 的 未 用 描述 符 数 
值 。 这 一 点 被 某 些 应 用 程序 用 来 在 标准 输入 、 标 准 输 出 或 标准 错误 上 
打开 新 的 文件 。 例 如 ， 一 个 应 用 程序 可 以 先 关 闭 标准 输出 (通常 是 
件 描述 符 1) ， 然 后 打开 另 一 个 文件 ， 执 行 打开 操作 前 就 能 了 解 到 该 文 
件 一 定 会 在 文件 描述 符 1 上 打开 。 在 3.12 节 说 明 dup2 函 数 时 ， 可 以 了 解 
到 有 更 好 的 方法 来 保证 在 一 个 给 定 的 描述 符 上 打开 一 个 文件 。 

fd 参数 把 open 和 openat 函 数 区 分 开 ， 共 有 3 种 可 能 性 。 

(1) path 参 数 指定 的 是 绝对 路 径 名 ， 在 这 种 情况 下 ，fd 参 数 被 忽 
WE. openat ex ZIGWLTH 4 T open EN 2» 


(2) path 参 数 指定 的 是 相对 路 径 名 ，fqd 参 数 指出 了 相对 路 径 名 在 
文件 系统 中 的 开始 地 址 。fd 参 数 是 通过 打开 相对 路 径 名 所 在 的 目录 来 获 
取 。 

(3) path 参 数 指定 了 相对 路 径 名 ，fd 参 数 具 有 特殊 值 
AT_FDCWD。 在 这 种 情况 下 ， 路 径 名 在 当前 工作 目录 中 获取 ，openat 
函数 在 操作 上 与 open 函 数 类 似 。 

openat 函 数 是 POSIX.1 最 新 版 本 中 新 增 的 一 类 函 数 之 一 ， 和 布 望 解决 
两 个 问题 。 第 一 ， 让 线程 可 以 使 用 相对 路 径 名 打开 目录 中 的 文件 ， 而 
不 再 只 能 打开 当前 工作 目录 。 在 第 11 章 我 们 会 看 到 ， 同 一 进程 中 的 所 
有 线程 共享 相同 的 当前 工作 目录 ， 因 此 很 难 让 同一 进程 的 多 个 不 同 线 
程 在 同一 时 间 工 作 在 不 同 的 目录 中 。 第 二 ， 可 以 避免 time-of-check-to- 
time-of-use (TOCTTOU) 错误 。 

TOCTTOU 错 误 的 基本 思想 是 : 如果 有 两 个 基于 文件 的 函数 调用 ， 
其 中 第 二 个 调用 依赖 于 第 一 个 调用 的 结果 ， 那 么 程序 是 脆弱 的 。 因 为 
两 个 调用 并 不 是 原子 操作 ， 在 两 个 函数 调用 之 间 文 件 可 能 改变 了 ， 这 
样 也 就 造成 了 第 一 个 调用 的 结果 就 不 再 有 效 ， 使 得 程序 最 终 的 结果 是 
错误 的 。 文 件 系统 命名 空间 中 的 TOCTTOU 错 误 通 常 处 理 的 就 是 那些 颠 
窗 文 件 系 统 权 限 的 小 把 戏 ， 这 些小 把 戏 通 过 骗取 特权 程序 降低 特权 文 
件 的 权限 控制 或 者 让 特权 文件 打开 一 个 安全 漏洞 等 方式 进行 。Wei 和 
Pu[2005] 在 UNIX 文 件 系 统 接口 中 讨论 了 TOCTTOU 的 缺陷 。 

文件 名 和 路 径 名 截断 

如 果 NAME_MAX 是 14， 而 我 们 却 试图 在 当前 目录 中 创建 一 个 文件 
名 包含 15 个 字符 的 新 文件 ， 此 时 会 发 生 什 么 昵 ? 按照 传统 ， 早 期 的 
System V 版 本 (如 SVR2) 允许 这 种 使 用 方法 ， 但 总 是 将 文件 名 截断 为 
14 个 字符 ， 而 且 不 给 出 任何 信息 ， 而 BSD 类 的 系统 则 返回 出 错 状 态 ， 
并 将 errno 设置 为 ENAMETOOLONG 。 无 声 无 息 地 截断 文件 名 会 引起 
问题 ， 而 且 它 不 仅仅 影响 到 创建 新 文件 。 如 果 NAME_MAX 是 14， 而 存 


在 一 个 文件 名 恰好 就 是 14 个 字符 的 文件 ， 那 么 以 路 径 名 作为 其 参数 的 
任 一 函数 (open、stat 等 ) 都 无 法 确定 该 文件 的 原始 名 是 什么 。 其 原因 
是 这 些 函 数 无 法 判断 该 文件 名 是 否 被 截断 过 。 

在 POSIX.1 中 ， 常 量 _ POSIX_NO_TRUNC 决 定 是 要 截断 过 长 的 文件 
名 或 路 径 名 ， 还 是 返回 一 个 出 错 。 正 如 我 们 在 第 2 章 中 已 经 见 过 的 ， 
根据 文件 系统 的 类 型 ， 此 值 可 以 变化 。 我 们 可 以 用 fpathconf 或 pathconf 
来 查询 目录 具体 支持 何 种 行为 ， 到 底 是 截断 过 长 的 文件 名 还 是 返回 出 
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是 否 返 回 一 个 出 错 值 在 很 大 程度 上 是 历史 形成 的 。 例 如 。 基 于 
SVR4 的 系统 对 传统 的 System V 文 件 系统 (S5) 并 不 出 错 ， 但 是 它 对 
BSD 风 格 的 文件 系统 (UFS) 则 出 错 。 作 为 男 一 个 例子 (参见 图 2- 
20) ，Solaris 对 UFS 返 回 出错 ， 对 与 DOS 兼 容 的 文件 系统 PCFS 则 不 返 
回 出 错 ， 其 原因 是 DOS 会 无 声 无 息 地 截断 不 匹配 8.3 格 式 的 文件 名 。 
BSD 类 系统 和 Linux 总 是 会 返回 出 错 。 

耕 _POSIX_NO_TRUNC 有 效 ， 则 在 整个 路 径 名 超过 PATH_MAX， 
或 路 径 名 中 的 任 一 文件 名 超过 NAME_MAX 时 ， 出 错 返 回 ， 并 将 ermo 
设置 为 ENAMETOOLONG 。 

大 多 数 的 现代 文件 系统 文 持 文件 名 的 最 大 长 度 可 以 为 255。 因 为 文 
件 名 通常 比 这 个 限制 要 短 ， 因 此 对 大 多 数 应 用 程序 来 说 这 个 限制 还 未 
出 现 什么 问题 。 


3.4 creat 


也 可 调用 creat 函 数 创建 一 个 新 文件 。 
#include <fcntl.h> 


int creat(const char *path, mode_t mode); 


返回 值 : ERJ, REAR STAN, ota, e- 

注意 ， 此 函数 等 效 于 : 

open(path, O WRONLY | O CREAT | O_TRUNC, mode); 

在 早期 的 UNIX 系 统 版 本 中 ，open 的 第 二 个 参数 只 能 是 0、1 或 2。 
无 法 打开 一 个 尚未 存在 的 文件 ， 因 此 需要 另 一 个 系统 调用 creat 以 创建 
新 文件 。 现 在 ，open 芳 数 提供 了 选 项 O_CREAT 和 O_TRUNC， 于 是 也 
就 不 再 需要 单独 的 creat 函 数 。 

在 4.5 世 中 ， 我 们 将 详细 说 明文 件 访问 权限 ， 并 说 明 如 何 指定 
mode ? 

creat 的 一 个 不 足 之 处 是 它 以 只 写 方式 打开 所 创建 的 文件 。 在 提供 
open 的 新 版 本 之 前 ， 如 有 果 要 创建 一 个 临时 文件 ， 并 要 先 写 该 文件 ， 然 
后 又 读 该 文件 ， 则 必须 先 调 用 creat、close， 然 后 再 调用 open。 现 在 则 
可 用 下 列 方式 调用 open 实 现 : 

open(path, O_RDWR | O_CREAT | O TRUNC, mode); 


3.5 close 


可 调用 close 函 数 天 闭 一 个 打开 文件 。 

#include <unistd.h> 

int close (int fd); 

返回 值 : ERJ, welo; Awe, we- 

天 闭 一 个 文件 时 还 会 释放 该 进程 加 在 该 文件 上 的 所 有 记录 锁 。14.3 
廊 将 讨论 这 一 点 。 

当 一 个 进程 终止 时 ， 内 核 目 动 关闭 它 所 有 的 打开 文件 。 很 多 程序 
都 利用 了 这 一 功能 而 不 显 式 地 用 close 关 闭 打 开 文 件 。 实 例 见 图 1-4 程 
序 。 


3.6 seek 


每 个 打开 文件 都 有 一 个 与 其 相关 联 的 “当前 文件 偏 移 量 ” (current 
file offset) 。 它 通常 是 一 个 非 负 整数 ， 用 以 度量 从 文件 开始 处 计算 的 字 
节 数 (本 节 稍 后 将 对 “ 非 负 ”这 一 修饰 词 的 某 些 例外 进行 说 明 ) 。 通 
常 ， 读 、 写 操作 都 从 当前 文件 偏 移 量 处 开始 ， 并 使 偏 移 量 增加 所 读 写 
的 字 广 数 。 按 系统 默认 的 情况 ， 当 打开 一 个 文件 时 ， 除 非 指 害 
O_APPEND Ii, d Ee CEN 。 

可 以 调用 lseek 显 式 地 为 一 个 打开 文件 设置 偏 移 量 。 

#include <unistd.h> 

off_t lseek(int fd, off_t offset, int whence); 

返回 值 : ERJ, RTC; te, AA- 

对 参数 offset 的 解释 与 参数 whence 的 值 有 天。 

“大 whence 十 SEEK_SET， 则 将 该 文件 的 偏 移 量 设置 为 距 文件 开始 
MhoffsetS T ° 

“ 若 whence 是 SEEK_CUR， 则 将 该 文件 的 偏 移 量 设置 为 其 当前 值 加 
offset，offset 可 为 正 或 负 。 

知 whence 是 SEEK_END， 则 将 该 文件 的 偏 移 量 设置 为 文件 长 度 加 
offset，offset 可 正 可 负 。 

藻 lseek 成 功 执行 ， 则 返回 新 的 文件 偏 移 量 ， 为 此 可 以 用 下 列 方式 
确定 打开 文件 的 当前 偏 移 量 : 

off t currpos; 

currpos = Iseek(fd, 0, SEEK. CUR); 

这 种 方法 也 可 用 来 确定 所 涉及 的 文件 是 否 可 以 设置 偏 移 量 。 如 果 
文件 描述 符 指 向 的 是 一 个 管道 、FIFO 或 网 络 套 接 字 ， 则 ]seek 返 回 -1， 
并 将 ermo 设 置 为 ESPIPE ° 


3 个 符号 常量 SEEK_SET、SEEK_CUR 和 SEEK_END 是 在 System V 

中 引入 的 。 在 System V 之 前 ，whence 被 指定 为 0 (绝对 偏 移 量 ) ^1 
(相对 于 当前 位 置 的 偏 移 量 ) 或 2 (相对 文件 尾 端的 偏 移 量 ) 。 很 多 软 

件 仍 然 把 这 些 数字 直接 写 在 代码 里 。 

在 lseek 中 的 字符 1] 表示 长 整 型 。 在 引入 offt_t 数 据 类 型 之 前 ，offset 参 
数 和 返回 值 是 长 整 型 的 。lseek 是 在 UNIX V7 中 引入 的 ， 当 时 C 语 言 中 增 
加 了 长 整 型 (在 UNIX V6 中 ， 用 函数 seek 和 tell 提 供 类 似 功 能 ) 。 

实例 

图 3-1 所 示 的 程序 用 于 测试 对 其 标准 输入 能 否 设 置 偏 移 量 。 


#include "apue.h" 
int 
main (void) 
{ 
if (lseek(STDIN FILENO, 0, SEEK CUR) == -1) 
printf("cannot seek\n"); 
else 
printf ("seek OK\n"); 
exit(0); 


) 


图 3-1 测试 标准 输入 能 否 被 设置 偏 移 量 
如 果 用 交互 方式 调用 此 程序 ， 则 可 得 

$ ./a.out < /etc/passwd 

seek OK 


$ cat < /etc/passwd| ./a.out 


— 


cannot seek 

$ /a.out < /var/spool/cron/FIFO 

cannot seek 

XE, SCAR AN SB ies Be Se SE I (Be, EKA 
也 可 能 允许 负 的 偏 移 量 。 但 对 于 普通 文件 ， 其 偏 移 量 必须 是 非 负 值 。 
因为 偏 移 量 可 能 是 负 值 ， 所 以 在 比较 lseek 的 返回 值 时 应 当 谨 愤 ， 不 要 
测试 它 是 否 小 于 0， 而 要 测试 它 是 否 等 于 -1 。 


在 Intel x86Nh FH as F35fTRJFreeBSDÉJ 1x f /dev/kmem 3C FF £A HJ fd Ee 


因为 偏 移 量 (off 0 是 带 符号 数据 类 型 ( 见 图 2-21) ， 所 以 文件 的 
最 大 长 度 会 减少 一 半 。 例 如 ， 车 off_t 是 32 位 整 型 ， 则 文件 最 大 长 度 是 
231 一 1 个 字 节 。 

lseek 仅 将 当前 的 文件 偏 移 量 记录 在 内 核 中 ， 它 并 不 引起 任何 W/O 操 
作 。 然 后 ， 该 偏 移 量 用 于 下 一 个 读 或 写 操 作 。 

文件 偏 移 量 可 以 大 于 文件 的 当前 长 度 ， 在 这 种 情况 下 ， 对 该 文件 
的 下 一 次 写 将 加 长 该 文件 ， 并 在 文件 中 构成 一 个 空洞， 这 一 点 是 允许 
的 。 位 于 文件 中 但 没有 写 过 的 字 届 都 被 读 为 0。 

文件 中 的 空洞 并 不 要 求 在 磁盘 上 占用 存储 区 。 上 有 具体 处 理 方式 与 文 
件 系统 的 实现 有 关 ， 当 定位 到 超出 文件 尾 端 之 后 写 时 ， 对 于 新 写 的 数 
据 需 要 分 配 磁盘 块 ， 但 是 对 于 原文 件 尾 端 和 新 开始 写 位 置 之 间 的 部 分 
则 不 需要 分 配 磁 盘 块 。 

实例 

图 3-2 所 示 的 程序 用 于 创建 一 个 具有 空 润 的 文件 。 


#include "apue.h" 
#include <fcntl.h> 


char bufl[] = "abcdefghij"; 
char buf2[] = "ABCDEFGHIJ"; 


int 
main (void) 
{ 
int fd; 


if ((fd = creat("file.hole", FILE MODE)) « 0) 
err sys("creat error"); 


if (write(fd, bufl, 10) != 10) 
err sys("bufl write error"); 
/* offset now - 10 */ 


if (lseek(fd, 16384, SEEK SET) == -1) 
err sys("lseek error"); 

/* offset now = 16384 */ 

if (write(fd, buf2, 10) !- 10) 
err sys("buf2 write error"); 


/* offset now - 16394 */ 


exit (0); 


运行 该 程序 得 到 : 


$ ./a.out 

$ Is -lfile.hole 今 碍 其 大 小 
-IW-r--r-- 1 sar 16394 Nov 25 01:01 file.hole 
$ od -c file.hole 观察 实际 内 容 


图 3-2 创建 一 个 具有 空洞 的 文件 
0000000abcdefghij 0000 0*0 
0000020 X0 \0 NO NO NO NO NO NO NO NO NO XO NO NO \0 VO 


米 


0040000 ABCDEFGHIJ 
0040012 


使 用 od(1) 命 令 观 察 该 文件 的 实际 内 容 。 命 令 行 中 的 -c 标 志 表 示 以 
字符 方式 打印 文件 内 容 。 从 中 可 以 看 到 ， 文 件 中 间 的 30 个 未 写 入 子 市 
都 被 读 成 0。 每 一 行 开始 的 一 个 7 位 数 是 以 八进制 形式 表示 的 字 广 偏 移 


EA 


Hm 


为 了 证 明 在 该 文件 中 确实 有 一 个 空洞 ， 将 刚 创 建 的 文件 与 同样 长 
度 但 无 空洞 的 文件 进行 比较 : 
$ Is -ls file.hole file.nohole 比较 长 度 
8 -rw-r--r-- 1 sar 16394 Nov 25 01:01 file.hole 
20 -rw-r--r-- 1 sar 16394 Nov 25 01:03 file.nohole 
虽然 两 个 文件 的 长 度 相 同 ， 但 无 空洞 的 文件 占用 了 20 个 人 磁 副 块 ， 
而 具有 空洞 的 文件 只 占用 8 个 磁盘 块 。 
在 此 实例 中 调用 了 将 在 3.8 节 中 说 明 的 write 画 数 。4.12 廊 将 对 具有 
空洞 的 文件 进行 更 多 说 明 。 
因为 lseek 使 用 的 偏 移 量 是 用 off_t 类 型 表示 的 ， 所 以 允许 具体 实现 
根据 各 目 特 定 的 平台 目 行 选择 大 小 合适 的 数据 类 型 。 现 今 大 多 数 平台 
提供 两 组 接口 以 处 理 文件 偏 移 量 。 一 组 使 用 32 位 文件 偏 移 量 ， 男 一 组 
则 使 用 64 位 文件 偏 移 量 。 
Single UNIX Specification 回 应 用 程序 提供 了 一 种 方法 ， 使 其 通过 
sysconf 函数 确定 支持 何 种 环境 ( 见 2.5.4 节 ) 。 图 3-3 总 结 了 定义 的 


sysconf 常 量 。 


选项 名 称 说 明 name 参数 


POSIX V7 ILP32 OFF32 int. long. 4##t#l off_t 类 型 是 32 位 _SC_V7_ILP32_OFF32 
POSIX V7 ILP32 OFFBIG int、long、 指 针 类 型 是 32 fy, off t KH | sC v7 ILP32 OFFBIG 
至 少 是 64 位 


POSIX V7 LP64 OFF64 int 类 型 是 32 i, long. REA off 上 类 | SC V7 LP64 OFF64 
型 是 64 位 

POSIX V7 LP64 OFFBIG int 类 型 是 32 i, long. HEM of f_t KH | SC V7 LP64 OFFBIG 
型 至 少 是 64 位 


图 3-3 sysconf 的 数据 大 小 选项 和 name 参 数 


c99 编译 器 要 求 使 用 getconf(1) tg SF PIT E B AA AC] oe A BR ST 
为 编译 和 链接 程序 所 需 的 标志 。 根 据 每 个 平台 文 持 环境 的 不 同 ， 可 能 
需要 不 同 的 标志 和 库 。 

遗憾 的 是 ， 在 这 方面 ， 实 现 还 未 跟 上 标准 的 步伐 。 如 果 你 的 系统 
没有 匹配 标准 的 最 新 版 本 ， 那 么 系统 还 可 能 文 持 Single UNIX 
Specification 前 一 版 本 中 的 选项 名 : POSIX V6 ILP32 OFF32 ` 
POSIX V6 ILP32 OFFBIG ^ . POSIX V6 LP64 OFF64 和 
POSIX. V6 LP64 OFFBIG ° 

为 了 避 开 这 一 点 ， 应 用 程序 可 以 将 符号 常量 _FILE_OFFSET_BITS 
设置 为 64， 以 支持 64 位 偏 移 量 。 这 样 就 将 off_t 定 义 更 改 为 64 位 带 符号 
整 型 。 将 FILE_OFFSET_BITS 符 号 常量 设置 为 32 以 文 持 32 位 偏 移 量 。 
但 是 ， 应 当 注 意 的 是 ， 虽 然 本 书 讨 论 的 4 种 平台 都 支持 32 位 和 64 位 文件 
偏 移 量 ， 但 是 通过 设置 FILE_OFFSET_BITS 符 号 常量 的 值 这 种 方法 并 
不 能 保证 应 用 程序 是 可 移植 的 ， 也 有 可 能 达 不 到 预期 的 效果 。 

图 3-4 总 结 了 在 本 书 涉及 的 4 种 平台 上 ， 当 应 用 程序 没有 定义 
FILE OFFSET BITS 时 ，offt 数 据 类 型 的 字 节 数 以 及 
_FILE_OFFSET_BITS 被 定义 成 32 或 64 时 ，off {数据 类 型 的 字 节 数 。 


FILE OFFSET BITS {ff 
操作 系统 CPU 架构 


FreeBSD 8.0 x86 32 位 
Linux 3.2.0 x86 64 位 
Mac OS X 10.6.8 x86 64 位 
Solaris 10 SPARC 64 位 


图 3-4 不 同 平台 上 off t 的 字 节 数 
注意 : 尽管 可 以 实现 64 位 文件 偏 移 量 ， 但 是 能 否 创建 一 个 大 于 2 
GB (231 一 1 字 节 ) 的 文件 则 依赖 于 底层 文件 系统 的 类 型 。 


3.7 ead 


Vil H read KRAFT A OCT P SEES ° 

#include <unistd.h> 

ssize_t read(int fd, void *buf, size_t nbytes); 

返回 值 : RAFT, BOB ce, eo; 者 出 钳 ， 返 回 -1 
如 read 成 功 ， 则 返回 读 到 的 字 太 数 。 如 已 到 达 文 件 的 尾 问 ， 则 返回 


有 多 种 情况 可 使 实际 读 到 的 字 世 数 少 于 要 求 读 的 字 世 数 : 

TOCA, fe BEB BR AZ BBA T FE m © Bil 
AH, FERAE Z BU30T ST, MEK LLOOTS FT, Dread 
返回 30。 下 一 次 再 调用 read 时 ， 它 将 返回 0 〈 文 件 尾 端 ) 

“ 当 从 终端 设备 读 时 ， 通 党 一 次 最 多 读 一 行 〈 第 18 章 将 介绍 如 何 改 
变 这 一 点 ) 

* 当 从 网 络 读 时 ， 网 络 中 的 缓冲 机 制 可 能 造成 返回 值 小 于 所 要 求 读 
HUE DAR ° 

CÁJACEDGHEXFIFOSEN, We PBST Taree, Jb 
么 read 将 只 返回 实际 可 用 的 字 市 数 。 

* 当 从 某 些 面向 记录 的 设备 (如 磁带) 读 时 ， 一 次 最 多 返回 一 个 记 
录 。 

* 当 一 信号 造成 中 断 ， 而 已 经 恋 了 部 分 数据 量 时 。 我 们 将 在 10.5 节 
进一步 讨论 此 种 情况 。 读 操作 从 文件 的 当前 偏 移 量 处 开始 ， 在 成 功 运 
回 之 前 ， 该 仿 移 量 将 增加 实际 读 到 的 字 市 数 。POSIX.1 从 几 个 方面 对 
read 函 数 的 原型 做 了 更 改 。 经 典 的 原型 定义 是 : 

int read(int fd, char *buf, unsigned nbytes); 


首先， 为 了 与 ISO C 一 致 ， 第 2 个 参数 由 char * 改 为 void *。 在 ISO 
C 中 ， 类 型 void * 用 于 表示 通用 指针 。 

其次， 返回 值 必须 是 一 个 带 符号 整 型 (ssize_t) ， 以 保证 能 够 返 
[By TE ea SO (表示 文件 尾 端 ) 或 -1 (出 错 ) o 

"最 后 ， 第 3 个 参数 在 历史 上 是 一 个 无 符号 整 型 ， 这 人 允许 一 个 16 位 的 
实现 一 次 读 或 写 的 数据 可 以 多 达 65 534 个 字 节 。 在 1990 POSIX.1 标准 
中 ， 引 入 了 新 的 基本 系统 数据 类 型 ssize_t 以 提供 带 符 号 的 返回 值 ， 不 带 
符号 的 size_t 则 用 于 第 3 个 参数 ( 见 2.5.2 节 中 的 SSIZE_MAX 常 量 ) ° 


3.8 write 


Vil Fd write EX ZA [RTT T PCE SS AGE o 

#include <unistd.h> 

ssize_t write(int fd, const void *buf, size_t nbytes); 

返回 值 : ERJ, REC SHS Pa, Suit e- 

其 返回 值 通常 与 参数 nbytes 的 值 相同 ， 否 则 表示 出 错 。write 出 错 的 
一 个 常见 原因 是 磁盘 已 写 满 ， 或 者 超过 了 一 个 给 定 进 程 的 文件 长 度 限 
制 ( 见 7.11 节 及 习题 10.11) ° 

对 于 普通 文件 ， 写 操作 从 文件 的 当前 偏 移 量 处 开始 。 如 果 在 打开 
该 文件 时 ， 指 定 了 O_APPEND 选 项 ， 则 在 每 次 写 操作 之 前 ， 将 文件 侦 
移 量 设置 在 文件 的 当前 结尾 处 。 在 一 次 成 功 写 之 后 ， 该 文件 偏 移 量 增 
加 实际 写 的 字 市 数 。 


3.9 /O 的 效率 


图 3-5 程 序 只 使 用 read 和 write 函数 复制 一 个 文件 。 


#include "apue.h" 


#define BUFFSIZE 4096 


n; 
char buf [BUFFSIZE]; 
while ((n = read(STDIN FILENO, buf, BUFFSIZE)) > 0) 
if (write (STDOUT FILENO, buf, n) !- n) 


err sys("write error"); 


Pt (n € 8) 


图 3-5 将 标准 输入 复制 到 标准 输出 

关于 该 程序 应 注意 以 下 几 点 。 

" 它 从 标准 输入 读 ， 写 至 标准 输出 ， 这 就 假定 在 执行 本 程序 之 前 ， 
这 些 标准 输入 、 输 出 已 由 shell 安 排 好 。 确 实 ， 所 有 常用 的 UNIX 系 统 
shell 都 提供 一 种 方法 ， 它 在 标准 输入 上 打开 一 个 文件 用 于 读 ， 在 标准 
输出 上 创建 (或 重 写 ) 一 个 文件 。 这 使 得 程序 不 必 打 开 输 入 和 输出 文 
件 ， 并 允许 用 户 利用 shell 的 W/O 重 定向 功能 。 

“考虑 到 进程 终止 时 ，UNIX 系 统 内 核 会 关闭 进程 的 所 有 打开 的 文件 
描述 符 ， 所 以 此 程序 并 不 关闭 输入 和 输出 文件 。 

"对 UNIX 系统 内 核 而 言 ， 文 本 文件 和 二 进 制 代 码 文件 并 无 区 别 ， 
所 以 本 程序 对 这 两 种 文件 都 有 效 。 

我 们 还 没有 回答 的 一 个 问题 是 如 何 选取 BUFFSIZE 值 。 在 回答 此 问 
题 之 前 ， 让 我 们 先 用 各 种 不 同 的 BUFFSIZE 值 来 运行 此 程序 。 图 3-6 显 
示 了 用 20 种 不 同 的 缓冲 区 长 度 ， 读 516 581 760 字 节 的 文件 所 得 到 的 结 
果 o 


— 


用 图 3-5 的 程序 读 文件 ， 其 标准 输出 被 重新 定向 到 /devnull 上 。 此 
测试 所 用 的 文件 系统 是 Linux ext4 文 件 系统 ， 其 磁盘 块 长 度 为 4 096 字 
(磁盘 块 长 度 由 stblksize 表 示 ， 在 4.12 节 中 说 明 其 值 为 4 096) 。 这 也 
证 明了 图 3-6 中 系统 CPU 时 间 的 几 个 最 小 值 差 不 多 出 现在 BUFFSIZE 
为 4 096 及 以 后 的 位 置 ， 继 续 增 加 缓冲 区 长 度 对 此 时 间 几 乎 没有 影响 。 


BUFFSIZE 用 户 CPU (s) 系统 CPU (s) 时 钟 时 间 Cs) 循环 次 数 


516 581 760 
258 290 880 
129 145 440 
64 572 720 
32 286 360 
16 143 180 
8 071 590 

4 035 795 

2 017 898 

1 008 949 
504 475 
252 238 
126 119 

63 060 

31 530 

15 765 

7 883 

3 942 

1971 

986 


524 288 


图 3-6 Linux 上 用 不 同 缓冲 长 度 进行 读 操作 的 时 间 结 果 

大 多 数 文件 系统 为 改善 性 能 都 采用 某 种 预 读 (read ahead) 技术 。 
当 检 测 到 正 进 行 顺序 读 取 时 ， 系 统 束 试图 读 入 比 应 用 所 要 求 的 更 多 数 
据 ， 并 假想 应 用 很 快 瑟 会 读 这 些 数据 。 预 读 的 效果 可 以 从 图 3-6 中 看 
出 ， 缓 冲 区 长 度 小 至 32 字 节 时 的 时 钟 时 间 与 拥有 较 大 缓冲 区 长 度 时 的 
时 钟 时 间 几 乎 一 样 。 

我 们 以 后 还 将 回 到 这 一 实例 上 。3.14 这 将 用 此 说 明 同 步 写 的 效 
果 ，5.8 节 将 比较 不 带 缓冲 的 MO 时 间 与 标准 VO 库 所 用 的 时 间 。 

应 当 了 解 ， 在 什么 时 间 对 实施 文件 读 、 写 操作 的 程序 进行 性 能 度 
量 。 操 作 系统 试图 用 高 速 缓存 技术 将 相关 文件 放置 在 主 存 中 ， 所 以 如 


若 重 复 度量 程序 性 能 ， 那 么 后 续 运 行 该 程序 所 得 到 的 计时 很 可 能 好 于 
第 一 次 。 其 原因 是 ， 第 一 次 运行 使 得 文件 进入 系统 高 速 缓存 ， 后 续 各 
次 运行 一 般 从 系统 高 速 缓存 访问 文件 ， 无 需 恋 、 写 人 磁盘 。 (incore 这 个 
词 的 意思 是 在 主 存 中 ， 早 期 计算 机 的 主 存 是 用 铁 氧 体 磁 心 (ferrite 
core) 做 的 ， 这 也 是 “core dump” 这 个 词 的 由 来 : 程序 的 主 存 镜像 存放 在 
人 磁盘 的 一 个 文件 中 以 便 测试 诊断 ) e 

在 图 3-6 所 示 的 测试 数据 中 ， 不 同 缓冲 区 长 度 的 各 次 运行 使 用 不 同 
的 文件 副本 ， 所 以 后 一 次 运行 不 会 在 前 一 次 运行 的 高 速 缓 存 中 找到 它 
需要 的 数据 。 这 些 文件 都 足够 大 ， 不 可 能 全 部 保留 在 高 速 缓存 中 QU 
试 系统 配置 了 6GB RAM) 。 


3.10 文件 共享 


UNIX 系 统 支 持 在 不 同 进程 间 共 享 打开 文件 。 在 介绍 dup 函 数 之 
前 ， 先 要 说 明 这 种 共享 。 为 此 先 介绍 内 核 用 于 所 有 IO 的 数据 结构 。 

下 面 的 说 明 是 概念 性 的 ， 与 特定 实现 可 能 匹配 ， 也 可 能 不 匹配 。 
请 参阅 Bach[1986] 对 System V 中 相关 数据 结构 的 讨论 。MCcKusick 等 
[1996] 说 明 4.4BSD 中 的 相关 数据 结构 。McKusick 和 Neville-Nell[2005] 
对 FreeBSD 5.2 进行 了 介绍 。 对 Solaris 的 类 似 讨 论 请 参见 McDougall 
和 Marno[2007] ° Linux 2.6 内核 体系 结构 介绍 请 参见 Bovet 和 
Cesati[2006] ° 

内 核 使 用 3 种 数据 结构 表示 打开 文件 ， 它 们 之 间 的 关系 决定 了 在 文 
件 共享 方面 一 个 进程 对 男 一 个 进程 可 能 产生 的 影响 。 

(1) 每 个 进程 在 进程 表 中 都 有 一 个 记录 项 ， 记 录 项 中 包含 一 张 打 

开 文 件 描述 符 表 ， 可 将 其 视 为 一 个 矢量 ， 每 个 描述 符 占用 一 项 。 与 每 
个 文件 描述 符 相 关联 的 是 : 


a. 文件 描述 符 标 志 (cose on exec, &MNWEÉ3-7513.3415) ; 
b. 指 辣 一 个 文件 表 项 的 指针 。 
(2) 内 核 为 所 有 打开 文件 维持 一 张 文 件 表 。 每 个 文件 表 项 包含 : 

a. 文件 状态 标志 ( 读 、 写 、 添 写 、 同 步 和 非 阻塞 等 ， 关 于 这 些 标 
志 的 更 多 信息 参见 3.14 节 ) ; 

b. 当前 文件 偏 移 量 ; 

c， 指 同 该 文件 v 世 点 表 项 的 指针 。 

(3) 每 个 打开 文件 (或 设备 ) 都 有 一 个 Vv 市 点 (v-node) 结构 。v 

廊 点 包含 了 文件 类 型 和 对 此 文件 进行 各 种 操作 图 数 的 指针 。 对 于 大 多 
数 文件 ，v 节 点 还 包含 了 该 文件 的 i 节点 (inode， 索 引 节 点 ) 。 这 些 信 
奶 是 在 打开 文件 时 从 磁 副 上 读 入 内 存 鸭 ， 所 以 ， 文 件 的 所 有 相关 信息 
都 是 随时 可 用 的 。 例 如 ，i 市 点 包含 了 文件 的 所 有 者 、 文 件 长 度 、 指 癌 
文件 实际 数据 块 在 磁盘 上 所 在 位 置 的 指针 等 (4.14 广 较 详细 地 说 明了 上 典 
型 UNIX 系 统 文件 系统 ， 并 将 更 多 地 介绍 i 节点 ) ° 

Linux 没 有 使 用 v 节 点 ， 而 是 使 用 了 通用 i 节 扣 结构 。 虽 然 两 种 实现 
有 所 不 同 ， 但 在 概念 上 ， v 和 点 与 诈 点 是 一 样 的 。 两 者 都 指 辐 文 件 系 
ZUR BJUD 点 结构 。 

我 们 忽略 了 那些 不 影响 讨论 的 实现 细 方 。 例 如 ， 打 开 文 件 描 述 符 
表 可 存放 在 用 户 空间 (作为 一 个 独立 的 对 应 于 每 个 进程 的 结构 ， 可 以 
S&H) ， 而 非 进程 表 中 。 这 些 表 也 可 以 用 多 种 方式 实现 ， 不 必 一 定 是 
数组 ， 例 如 ， 可 将 它们 实现 为 结构 的 链表 。 如 有 果 不 考 虚 实现 细 市 的 
话 ， 通 用 概念 是 相同 的 。 

图 3-7 显 示 了 一 个 进程 对 应 的 3 张 表 之 间 的 天 系 。 该 进程 有 两 个 不 同 
的 打开 文件 ， 一 个 文件 从 标准 输入 打开 (文件 描述 符 0)y ， 另 一 个 从 标 
准 输出 打开 (文件 描述 符 为 1) 。 


进程 表 项 文件 表 项 v 节点 表 项 


文件 状态 标志 v 节 点 信息 A 
fd 当前 文件 偏 移 量 [D "933a "1 
标志 文件 指针 | \ 


la vidi ——— i 节点 \ 
e 四 点 信息 \ 
文件 状态 标志 | ara 
当前 文件 偏 移 量 | 
v a 了 节点 表 项 


vaa A 


t v_data \ 
\ i 节点 \ 
i 节 点 信息 \ 


图 3-7 打开 文件 的 内 核 数据 结构 


从 UNIX 系 统 的 早期 版 本 [Thompson 1978] 以 来 ， 这 3 张 表 之 间 的 关 
系 一 直 保 持 至 今 。 这 种 关系 对 于 在 不 同 进程 之 间 共 享 文件 的 方式 非常 
重要 。 在 以 后 的 章节 中 涉及 其 他 文件 共享 方式 时 还 会 回 到 这 张 图 上 
来 o 
创建 v 节点 结构 的 目的 是 对 在 一 个 计算 机 系统 上 的 多 文件 系统 
型 提供 支持 。 这 一 工作 是 Peter Weinberger (贝尔 实验 室 ) 和 Bill Joy 
(Sun 公 司 ) 分 别 独 立 完 成 的 。Sun 把 这 种 文件 系统 称 为 虚拟 文件 系统 
(Virtual File System) ， 把 与 文件 系统 无 关 的 i 节点 部 分 称 为 v 闻 点 
[Kleiman 1986] ° 
当 各 个 制造 商 的 实现 增加 了 对 Sun 的 网 络 文件 系统 (NFS) 的 支持 
上 时， 它们 都 广泛 采用 了 Vv 方太 结构 。 在 BSD 系 列 中 首先 提供 Vv 市 点 的 是 
增加 了 NFS 的 4.3BSD Reno * 
在 SVR4 中 ，v 广 点 蔡 代 了 SVR3 中 与 文件 系统 无 天 的 i 节点 结构 。 
Solaris 古 从 SVR4 发 展 而 来 的 ， 因 此 它 也 使 用 v 玉 后。 


Linux 没 有 将 相关 数据 结构 分 为 节点 和 v 广 点 ， 而 是 采用 了 一 个 与 
文件 系统 相关 的 i 护 和 一 个 与 文件 系统 无 关 的 i 太太 。 

如 果 两 个 独立 进程 各 自打 开 了 同一 文件 ， 则 有 图 3-8 中 所 示 的 关 
系 。 


进程 表 项 


fd 
标志 ”文件 指针 


文件 表 项 
| “文件 状态 标志 
当前 文件 篇 移 量 
v 节点 指针 —— 
bum 
进程 表 项 v 节点 信息 A 
| : 文件 表 项 / 上 -- ti - \ 
v t 
m 文件 指针 文件 状态 标志 / O \ 
fd 1: | 当前 文件 偏 移 量 E. : = \ 
fd 3 | vitii 一 一 BR. — E 
fd 4: | -当前 文件 长 度 | ， 
i vnode 下 -一 一 


图 3-8 两 个 独立 进程 各 自打 开 同 一 个 文件 


我 们 假定 第 一 个 进程 在 文件 摘 述 符 3 上 打开 该 文件 ， 而 另 一 个 进程 
在 文件 摘 述 符 4 上 打开 该 文件 。 打 开 该 文件 的 每 个 进程 都 获得 各 目的 一 
个 文件 表 项 ， 但 对 一 个 给 定 的 文件 只 有 一 个 v 市 点 表 项 。 之 所 以 每 个 进 
程 都 获得 目 己 的 文件 表 项 ， 和 是 因为 这 可 以 使 每 个 进程 都 有 它 目 己 的 对 
该 文件 的 当前 偏 移 量 。 

给 出 了 这 些 数据 结构 后 ， 现 在 对 前 面 所 述 的 操作 进一步 说 明 。 

“在 完成 每 个 write 后 ， 在 文件 表 项 中 的 当前 文件 偶 移 量 即 增加 所 写 
入 的 字 市 数 。 如 果 这 导致 当前 文件 偏 移 量 超出 了 当前 文件 长 度 ， 则 将 i 


节点 表 项 中 的 当前 文件 长 度 设置 为 当前 文件 偏 移 量 (也 就 是 该 文件 加 
xg. 

“如 采用 O_APPEND 标 志 打 开 一 个 文件 ， 则 相应 标志 也 被 设置 到 文 
件 表 项 的 文件 状态 标志 中 。 每 次 对 这 种 具有 追加 写 标 志 的 文件 执行 写 
操作 时 ， 文 件 表 项 中 的 当前 文件 偏 移 量 首先 会 被 设置 为 i 节 点 表 项 中 的 
文件 长 度 。 这 就 使 得 每 次 写 入 的 数据 都 追加 到 文件 的 当前 尾 端 处 。 

。 若 一 个 文件 用 lseek 定 位 到 文件 当前 的 尾 端 ， 则 文件 表 项 中 的 当前 
文件 偏 移 量 被 设置 为 i 节 点 表 项 中 的 当前 文件 长 度 (注意 ， 这 与 用 
O_APPEND 标 志 打开 文件 是 不 同 的 ， 详 见 3.11 节 ) 。 

"lseek 函 数 只 修改 文件 表 项 中 的 当前 文件 偏 移 量 ， 不 进行 任何 1/O 操 
作 。 

可 能 有 多 个 文件 描述 符 项 指向 同一 文件 表 项 。 在 3.12 节 中 讨论 dup 
函数 时 ， 我 们 就 能 看 到 这 一 点 。 在 fork 后 也 发 生 同 样 的 情况 ， 此 时 父 进 
程 、 子 进程 各 自 的 每 一 个 打开 文件 描述 符 共 享 同 一 个 文件 表 项 〈 见 8.3 
节 ) 。 

注意 ， 文 件 描述 符 标志 和 文件 状态 标志 在 作用 范围 方面 的 区 别 ， 
前 者 只 用 于 一 个 进程 的 一 个 描述 符 ， 而 后 者 则 应 用 于 指向 该 给 定 文件 
表 项 的 任何 进程 中 的 所 有 描述 符 。 在 3.14 节 说 明 fcnt 函 数 时 ， 我 们 将 会 
了 解 如 何 获取 和 修改 文件 描述 符 标 志和 文件 状态 标志 。 

本 节 前 面 所 述 的 一 切 对 于 多 个 进程 读 取 同 一 文件 都 能 正确 工作 。 
每 个 进程 都 有 它 自 己 的 文件 表 项 ， 其 中 也 有 它 自己 的 当前 文件 偏 移 
量 。 但 是 ， 当 多 个 进程 写 同一 文件 时 ， 则 可 能 产生 预想 不 到 的 结 
为 了 说 明 如 何 避 免 这 种 情况 ， 需 要 理解 原子 操作 的 概念 。 


3.11 原子 操作 


1. EJ] —^ XC fe 

AE DHIE, EC BOR BG DE — T CF edm ^ 8BRBJUNIX AR 
统 版 本 并 不 支持 open 的 O_APPEND 选 项 ， 所 以 程序 被 编写 成 下 列 形 
zo 

if (Iseek(fd,OL, 2) < 0) /*position to EOF*/ 

if (write(fd, buf, 100) != 100) /*and write*/ 


err sys("Iseek error"); 


err sys("write error"); 

对 单个 进程 而 言 ， 这 段 程序 能 正常 工作 ， 但 若 有 多 个 进程 同时 使 
用 这 种 方法 将 数据 追加 写 到 同一 文件 ， 则 会 产生 问题 〈 例 如 ， 老 此 程 
序 由 多 个 进程 同时 执行 ， 各 自 将 消息 追加 到 一 个 日 志文 件 中 ， 束 会 产 
生 这 种 情况 ) 。 

假定 有 两 个 独立 的 进程 A 和 B 都 对 同一 文件 进行 追加 写 操 作 。 每 个 
进程 都 已 打开 了 该 文件 ， 但 未 使 用 O_APPEND 标 志 。 此 时 ， 各 数据 结 
构 之 间 的 关系 如 图 3-8 中 所 示 。 每 个 进程 都 有 它 目 己 的 文件 表 项 ， 但 是 
共享 一 个 v 节 点 表 项 。 假 定 进程 A 调用 了 lseek， 它 将 进程 A 的 该 文件 当 
前 偏 移 量 设置 为 1 500 字 市 (当前 文件 尾 端 处 ) 。 然 后 内 核 切换 进程 ， 
进程 B 运 行 。 进 程 B 执 行 lseek， 也 将 其 对 该 文件 的 当前 偶 移 量 设置 为 1 
500 字 节 (当前 文件 尾 端 处 ) 。 然 后 B 调 用 write， 它 将 B 的 该 文件 当前 
文件 偏 移 量 增加 人 至 1 600。 因 为 该 文件 的 长 度 已 经 增加 了 ， 所 以 内 核 将 v 
节点 中 的 当前 文件 长 度 更 新 为 1 600。 然 后 ， 内 核 又 进行 进程 切换 ， 使 
进程 A 恢复 运行 。 当 A 调用 write 时 ， 束 从 其 当前 文件 偏 移 量 (1500) 处 
开始 将 数据 写 入 到 文件 。 这 样 也 就 覆盖 了 进程 B 刚 才 写 入 到 该 文件 中 的 
数据 。 

问题 出 在 逻辑 操作 “ 先 定位 到 文件 尾 端 ， 然 后 写 ”"， 它 使 用 了 两 个 
分 开 的 函数 调用 。 解 决 问 题 的 方法 是 使 这 两 个 操作 对 于 其 他 进程 而 言 
成 为 一 个 原子 操作 。 任 何 要 求 多 于 一 个 函数 调用 的 操作 都 不 是 原子 操 


作 ， 因 为 在 两 个 函数 调用 之 间 ， 内 核 有 可 能 会 临时 挂 起 进程 (正如 我 
们 前 面 所 假定 的 ) 。 

UNIX 系 统 为 这 样 的 操作 提供 了 一 种 原子 操作 方法 ， 即 在 打开 文件 
时 设置 O0_APPEND 标 志 。 正 如 前 一 节 中 所 述 ， 这 样 做 使 得 内 核 在 每 次 
写 损 作 之 前 ， 都 将 进程 的 当前 偏 移 量 设置 到 该 文件 的 尾 端 处 ， 于 是 在 
每 次 写 之 前 就 不 再 需要 调用 ]seek。 

2 .图 数 pread 和 pwrite 

Single UNIX Specification 包 括 了 XSI 扩 展 ， 该 扩展 允许 原子 性 地 定 
位 并 执行 WO。pread 和 pwrite 就 是 这 种 扩展 。 


#include <unistd.h> 


ssize_t pread(int fd, void *buf, size_t nbytes, off_t offset); 

返回 值 : WERJBUTECDAM, BOB cee, Kl; 者 出 钳 ， 返 回 -1 

ssize t pwrite(int fd, const void *buf, size t nbytes, off t offset); 

返回 值 : ERJ, REC SOS PN, Sut e- 

调用 pread 相 当 于 调用 lseek 后 调用 read， 但 是 pread 又 与 这 种 顺序 调 
用 有 下 列 重要 区 别 。 

“调用 pread 时 ， 无 法 中 断 其 定位 和 读 操 作 。 

"不 更 新 当前 文件 偏 移 量 。 

调用 pwrite 相 当 于 调用 lseek 后 调用 write， 但 也 与 它们 有 类 似 的 区 
fill ° 

3u 创 建 一 个 文件 

对 open 画 数 的 O_CREAT 和 O_EXCL 选 项 进行 说 明 时 ， 我 们 已 见 到 
另 一 个 有 关 原 子 操作 的 例子 。 当 同时 指定 这 两 个 选项 ， 而 该 文件 又 已 
经 存在 时 ，open 将 失败 。 我 们 曾 提 及 检查 文件 是 否 存在 和 创建 文件 这 
两 个 操作 是 作为 一 个 原子 操作 执行 的 。 如 果 没 有 这 样 一 个 原子 操作 ， 
那么 可 能 会 编写 下 列 程序 段 : 

if ((fd = open(pathname, O WRONLY)) <0){ 


if (errno == ENOENT) { 
if ((fd = creat(path, mode)) < 0) 
err_sys("creat error"); 
} else{ 
err sys("open error"); 
j 

j 

如 有 果 在 open 和 creat 之 间 ， 另 一 个 进程 创建 了 该 文件 ， 就 会 出 现 问 
题 。 知 在 这 两 个 函数 调用 之 间 ， 另 一 个 进程 创建 了 该 文件 ， 并 且 写 入 
了 一 些 数据 ， 然 后 ， 原 先进 程 执行 这 上 段 程序 中 的 creat， 这 时 ， 刚 由 男 
一 进程 写 入 的 数据 怠 会 被 控 去 。 如 者 将 这 两 者 合并 在 一 个 原子 操作 
中 ， 这 种 问题 也 束 不 会 出 现 。 

一 般 而 言 ， 原 子 操作 (atomic operation) 指 的 是 由 多 步 组 成 的 一 个 
操作 。 如 采 该 操作 原子 地 执行 ， 则 要 么 执行 完 所 有 步骤 ， 要 么 一 步 也 
不 执行 ， 不 可 能 只 执行 所 有 步骤 的 一 个 子 集 。 在 4.15 世 描述 link 函 数 以 
及 在 14.3 节 中 说 明 记 录 锁 时 ， 还 将 讨论 原子 操作 。 


3.12 图 数 dup 和 dup2 


下 面 两 个 范 数 都 可 用 来 复制 一 个 现 有 的 文件 搬 述 符 。 

#include <unistd.h> 

int dup(int fd); 

int dup2(int fd, int fd2); 

两 函数 的 返回 值 : ARD, RSC; ate, e- 

由 dup 返 回 的 新 文件 描述 符 一 定 是 当前 可 用 文件 描述 符 中 的 最 小 数 
值 。 对 于 dup2， 可 以 用 fd2 参 数 指定 新 描述 符 的 值 。 如 有 果 fd2 已 经 打 


开 ， 则 先 将 其 关闭 。 如 车 fd 等 于 fd2， 则 dup2 返 回 fd2， 而 不 关闭 它 。 否 
则 ，fd2 的 FD_CLOEXEC 文 件 描述 符 标 志 就 被 清除 ， 这 样 fd2 在 进程 调 
用 exec 时 是 打开 状态 。 

这 些 函 数 返 回 的 新 文件 描述 符 与 参数 fd 共 译 同一 个 文件 表 项 ， 如 图 
3-9 所 示 。 


进程 表 项 
td 文件 指针 文件 表 v 节点 表 
wee EL v 节点 信息 
: | 当前 文件 偏 移 量 si | 
|v 节点 指针 © 
i 节点 信息 
mics  ] 
[^ ivnde ”十 


图 3-9 dup(1) 后 的 内 核 数 据 结 构 

在 此 图 中 ， 我 们 假定 进程 启动 时 执行 了 : 

newfd = dup(1); 

当 此 函数 开始 执行 时 ， 假 定 下 一 个 可 用 的 描述 符 是 3 (这 是 非常 可 
能 的 ， 因 为 0，1 和 2 都 由 shell 打 开 ) 。 因 为 两 个 描述 符 指向 同一 文件 表 
项 ， 所 以 它们 共享 同一 文件 状态 标志 ( 读 、 写 、 追 加 等 ) 以 及 同一 当 
Bil SC UP ER TRE ° 

每 个 文件 描述 符 都 有 它 目 己 的 一 套 文 件 描 述 待 标志 。 正 如 我 们 将 
在 下 一 市 中 说 明 的 那样 ， 新 描述 符 的 执行 时 关闭 (close-on-exec) 标志 
Jaze FA dup kk 2x78 BR ° 

复制 一 个 描述 符 的 另 一 种 方法 是 使 用 fcntl 函数 ，3.14 TEE 
数 进行 说 明 。 实 际 上 ， 调 用 

dup(fd); 

等 效 于 


fcntl (fd, F DUPFD, 0); 
而 调用 
dup2(fd, fd2); 
等 效 于 
close(fd2); 
fcntl(fd, F DUPFD, fd2); 
在 后 一 种 情况 下 ，dup2 并 不 完全 等 同 于 close 加 上 fcntl。 它 们 之 间 
的 区 别 具 体 如 下 。 
(1) dup2 是 一 个 原子 操作 ， 而 close 和 fentl 包括 两 个 函数 调用 。 
有 可 能 在 close 和 fcnt 之 间 调 用 了 信和 号 捕获 函数 ， 它 可 能 修改 文件 描述 
F (第 10 章 将 说 明 信 号 ) 。 如 果 不 同 的 线程 改变 了 文件 描述 符 的 话 也 
会 出 现 相 同 的 问题 \ 第 11 章 将 说 明 线程 ) 。 
(2) dup2 和 fcntt 有 一 些 不 同 的 ermo。 
dup2 系 统 调用 起 源 于 V7， 然 后 传播 至 所 有 BSD 版 本 。 而 复制 文件 
摘 述 符 的 fcnt 方 法 则 首先 由 系统 II 使 用 ， 然 后 由 System V 继 续 采 用 。 
SVR3.2 选 用 了 dup2 函 数 ，4.2BSD 则 选用 了 fcnt 本 数 及 FE_DUPFD 功 能 ° 
POSIX.1 要 求 兼 有 dup2 及 fcntl 的 F_DUPFD 两 种 功能 。 


3.13 函数 sync、fsync 和 fdatasync 


传统 的 UNIX 系 统 实 现在 内 核 中 设 有 缓冲 区 高 速 缓存 或 页 高 速 组 
人 存 ， 大 多 数 磁盘 IO 都 通过 缓冲 区 进行 。 当 我 们 同文 件 写 入 数据 时 ， 内 
核 通 常 先 将 数据 复制 到 缓冲 区 中 ， 然 后 排 入 队列 ， 晚 些 时 候 再 写 入 磁 
。 这 种 方式 被 称 为 延迟 写 (delayed write) (Bach[1986] 的 第 3 章 详细 
讨论 了 缓冲 区 高 速 缓存 ) 。 


通常 ， 当 内 核 需 要 重用 绥 冲 区 来 存放 其 他 磁盘 块 数据 时 ， 它 会 把 
所 有 延迟 写 数 据 块 写 入 磁盘。 为 了 你 证 人 磁盘 上 实际 文件 系统 与 缓冲 区 
中 内 容 的 一 致 性 ，UNIX 系统 提供 了 sync、fsync $ fdatasync = “+ E 
TW o 


#include<unistd.h> 


int fsync(int fd); 
int fdatasync(int fd); 
返回 值 : EH, welo; Awe, e- 
void sync(void); 
sync 只 是 将 所 有 修改 过 的 块 缓冲 区 排 入 写 队 列 ， 然 后 就 返回 ， 它 并 
` 等 待 实际 写 磁盘 操作 结 
通常 ， 称 为 update 的 系统 守护 进程 周期 性 地 调用 (一 般 每 隔 30 秒 ) 
sync 团 数 。 这 就 保证 了 定期 冲洗 (flush) 内 核 的 块 缓冲 区 。 命 令 sync(1) 
也 调用 sync 函 数 。 
fsync 芳 数 只 对 由 文件 接 述 符 fd 指 定 的 一 个 文件 起 作用 ， 并 且 等 得 
写 人 磁盘 操作 结束 才 返 回 。fsync 可 用 于 数据 库 这 样 的 应 用 程序 ， 这 种 应 
用 程序 需要 确保 修改 过 的 块 立即 写 到 磁 副 上 。 
fdatasync 芳 数 类 似 于 fsync， 但 它 只 影响 文件 的 数据 部 分 。 而 除数 
据 外 ，fsync 还 会 同步 更 新 文件 的 属性 。 
本 书 说 明 的 所 有 4 种 平台 都 支持 sync 和 fsync 碎 数 。 但 是 ，FreeBSD 8.0 不 
支持 fdatasync ° 


3.14 fcntl 


fcntl 函 数 可 以 改变 已 经 打开 文件 的 属性 。 


#include<fcntl.h> 


int fentl(int fd, int cmd, ... /* int arg */); 
返回 值 ， 若 成 功 ， 则 依赖 于 cmd (LT) ; 若 出 错 ， 返 回 -1 

在 本 市 的 各 实例 中 ， 第 3 个 参数 总 是 一 个 整数 ， 与 上 面 所 示 画 数 原 
型 中 的 注释 部 分 对 应 。 但 是 在 14.3 节 说 明 记 录 锁 时 ， 第 3 个 参数 则 是 指 
向 一 个 结构 的 指针 。 

fcntl 函 数 有 以 下 5 种 功能 。 

(1) 复制 一 个 已 有 的 描述 符 ( cmd=F_DUPFD 或 
F_DUPFD_CLOEXEC) 。 

(2) 获取 /设置 文件 描述 符 标志 (cmd=F_GETFD2%F_SETFD) 。 

(3) 获取 /设置 文件 状态 标志 (cmd-F GETFLZXF SETFL) 。 

(4) 获取 /设置 异步 VO 所有权 ( cmd=F_GETOWN 或 
F_SETOWN) 。 

(5) 获取 /设置 记录 锁 ( cmd=F_GETLK ^ F SETLK 或 
F SETLKW) ° 

我 们 先 说 明 这 11 种 cmd 中 的 前 8 种 (14.3 节 说 明 后 3 种 ， 它 们 都 与 记 
录 锁 有 关 ) 。 参 照 图 3-7， 我 们 将 讨论 与 进程 表 项 中 各 文件 描述 符 相 关 
联 的 文件 描述 符 标志 以 及 每 个 文件 表 项 中 的 文件 状态 标志 。 

F_DUPFD 复制 文件 描述 符 fd。 新 文件 描述 符 作为 函数 值 
返回 。 它 是 尚未 打开 的 各 描述 符 中 大 于 或 等 于 第 3 个 参数 值 ( 取 为 整 型 
值 ， 中 各 值 的 最 小 值 。 新 描述 符 与 fd 共享 同一 文件 表 项 ( 见 图 3-9) ° 
但 是 ， 新 描述 符 有 它 目 己 的 一 套 文件 描述 符 标 六 ， 其 FD_CLOEXEC 
文件 描述 符 标 志 被 清除 (这 表示 该 描述 符 在 exec 时 仍 保持 有 效 ， 我 们 将 
在 第 8 章 对 此 进行 讨论 ) 。 

F DUPFD CLOEXEC 复制 文件 摘 述 符 ， 设 置 与 新 描述 符 关 联 的 
FD_CLOEXEC 文 件 描述 符 标 志 的 值 ， 返 回 新 文件 描述 符 。 

F GETFD 对 应 于 fd 的 文件 描述 符 标 志 作 为 函数 值 返回 。 当 前 只 定 
义 了 一 个 文件 描述 符 标 志 FD_CLOEXEC ° 


F SETFD 对 于 fd 设置 文件 描述 符 标 志 。 新 标志 值 按 第 3 个 参数 (AL 
为 整 型 值 ) o 

要 知道 ， 很 多 现 有 的 与 文件 描述 符 标 志 有 关 的 程序 并 不 使 用 常 
FD CLOEXEC, pnm (系统 默认 ， 在 exec 时 不 关闭 ) 
或 1 (在 exec 时 关闭 ) 。 

F GETFL 对 应 于 fd 的 文件 状态 标志 作为 函数 信 返 回 。 我 们 在 说 明 
open 芳 数 时 ， 已 描述 了 文件 状态 标志 。 它 们 列 在 图 3-10 中 。 


文件 状态 标志 


O_RDONLY 

O_WRONLY 

O_RDWR 

O EXEC 

O SEARCH 只 搜索 打开 目录 


O APPEND 追加 写 

O NONBLOCK 非 阻 塞 模式 

O SYNC 等 待 写 完成 (数据 和 属性 ) 

O DSYNC 等 待 写 完 成 〈 仅 数据 ) 

O RSYNC 同步 读 和 写 

O_FSYNC 等 待 写 完成 ( 仅 FreeBSD 和 Mac OS X) 
O ASYNC 异步 VO X FreeBSD 和 Mac OS X) 


图 3-10 对 于 fcntl 的 文件 状态 标志 

遗憾 的 是 ，5 个 访问 方式 标志 (O_RDONLY + O_WRONLY ^ 
O_RDWR、O_EXEC 以 及 O_SEARCH) 并 不 各 占 1 位 〈 如 前 所 述 ， 由 于 
历史 原因 ， 前 3 个 标志 的 值 分 别 是 0、1 和 2。 这 5 个 值 互 斥 ， 一 个 文件 的 
访问 方式 只 能 取 这 5 个 值 之 一 ) 。 因 此 首先 必须 用 屏蔽 字 O_ACCMODE 
取得 访问 方式 位 ， 然 后 将 结果 与 这 5 个 值 中 的 每 一 个 相 比 较 。 

F SETFL 将 文件 状态 标志 设置 为 第 3 个 参数 的 值 ( 取 为 整 型 值 ) 。 
可 以 更 改 的 几 个 标志 是 : O_APPEND、O_NONBLOCK、O_SYNC、 
O_DSYNC、O_RSYNC、O_FSYNC 和 O_ASYNC ° 


F GETOWN 获取 当前 接收 SIGIO 和 SIGURG 信 和 号 的 进程 ID 或 进程 
组 ID。14.5.2 世 将 论述 这 两 种 异步 JO 信 和 号 。 

F SETOWN 设置 接收 SIGIO 和 SIGURG 信 和 号 的 进程 ID 或 进程 组 
ID。 正 的 arg 指 定 一 个 进程 ID， 负 的 arg 表 示 等 于 arg 绝 对 值 的 一 个 进程 
组 ID。 

fcntl 的 返回 值 与 命令 有 关 。 如 果 出 错 ， 所 有 命令 都 返回 一 1， 如 果 
成 功 则 返回 某 个 其 他 值 。 下 列 4 个 命令 有 特定 返回 值 : F_DUPFD ` 
F_GETFD、F_GETFL 以 及 F_GETOWN 。 第 1 个 命令 返回 新 的 文件 描述 
符 ， 第 2 个 和 第 3 个 命令 返回 相应 的 标志 ， 最 后 一 个 命令 返回 一 个 正 的 
进程 ID 或 负 的 进程 组 ID。 

实例 

图 3-11 中 所 示 程 序 的 第 1 个 参数 指定 文件 描述 符 ， 并 对 于 该 描述 符 
打印 其 所 选择 的 文件 标志 说 明 。 


#include "apue.h" 
#include «fcntl.h» 


int 
main(int argc, char *argv[]) 
{ 


int val; 


if (argc != 2) 
err quit("usage: a.out <descriptor#>") ; 


if ((val = fcntl(atoi(argv[1]), F GETFL, 0)) « 0) 
err sys("fcntl error for fd $d", atoi(argv[1])); 


switch (val & O ACCMODE) ( 
case O RDONLY: 
printf ("read only"); 
break; 


case O WRONLY: 
printf("write only"); 
break; 


case O RDWR: 
printf ("read write"); 
break; 


default: 
err dump("unknown access mode"); 


if (val & O APPEND) 
printf(", append"); 
if (val & O NONBLOCK) 
printf(", nonblocking"); 
if (val & O SYNC) 
printf(", synchronous writes"); 


#if !defined( POSIX C SOURCE) && defined(O FSYNC) && (O FSYNC !- O SYNC) 


if (val & O FSYNC) 
printf(", synchronous writes"); 


#endif 


putchar('\n'); 
exit (0); 


图 3-11 对 于 指定 的 描述 符 打印 文件 标志 


注意 ， 我 们 使 用 了 功能 测试 宏 _POSIX_C_SOURCE， 并 且 条 件 编 
译 了 POSIX.1 中 没有 定义 的 文件 访问 标志 。 下 面 显示 了 从 bash (Bourne- 


again shell) 调用 该 程序 时 的 几 种 情况 。 当 使 用 不 同 shell 时 ， 结 果 会 有 
BEAN Te] ° 

$./a.out 0 < /dev/tty 

read only 

$./a.out 1 > temp.foo 

$ cat temp.foo 

write only 

$./a.out 2 2>>temp.foo 

write only, append 

$./a.out 5 5<>temp.foo 

read write 

子 句 5<>temp.foo 表 示 在 文件 描述 符 5 上 打开 文件 temp.foo 以 供 读 、 
写 o 

实例 

在 修改 文件 接 述 符 标 志 或 文件 状态 标志 时 必须 弃 慎 ， 先 要 获得 现 
在 的 标志 值 ， 然 后 按照 期 望 修改 它 ， 最 后 设置 新 标志 值 。 不 能 只 是 执 
fTF SETFD 或 RF_SETFL 命 令 ， 这 样 会 关闭 以 前 设置 的 标志 位 。 

图 3-12 是 对 于 一 个 文件 描述 符 设 置 一 个 或 多 个 文件 状态 标志 的 函 
TW o 


#include "apue.h" 
#include «fcntl.h» 


void 
set_fl(int fd, int flags) /* flags are file status flags to turn on */ 
{ 


int val; 


if ((val = fentl(fd, F GETFL, 0)) < 0) 
err sys("fcntl F GETFL error"); 


val |= flags; /* turn on flags */ 


if (fcntl(fd, F SETFL, val) < 0) 
err sys("fcntl F SETFL error"); 


图 3-12 对 一 个 文件 描述 符 开启 一 个 或 多 个 文件 状态 标志 

如 有 宁 将 中 间 的 一 条 语句 改 为 : 

val &- ~flags; /* turn flags off */ 

就 构成 另 一 个 函数 ， 我 们 称 为 dr f， 并 将 在 后 面 某 些 例子 中 用 到 
它 。 此 语句 使 当前 文件 状态 标志 值 val 与 flags 的 反 码 进 行 逻辑 “与 * 运 
Fo 


如 有 果 在 图 3-5 程 序 的 开始 处 加 上 下 面 一 行 以 调用 set_ fl, WFR T [n] 
步 写 标志 。 

set fl(STDOUT. FILENO, O_SYNC); 

这 就 使 每 次 write 都 要 等 待 ， 直 至 数据 已 写 到 人 磁盘 上 再 返回 。 在 
UNIX 系 统 中 ， 通 常 write 只 是 将 数据 排 入 队列 ， 而 实际 的 写 人 磁盘 操作 则 
可 能 在 以 后 的 某 个 时 刻 进行 。 而 数据 库 系 统 则 需要 使 用 O_SYNC， 这 
样 一 来 ， 当 它 从 write 返回 时 就 知道 数据 已 确实 写 到 了 磁盘 上 ， 以 免 在 
系统 异常 时 产生 数据 丢失 。 

程序 运行 时 ， 设 置 O_SYNC 标 志 会 增加 系统 时 间 和 时 钟 时 间 。 为 
了 测试 这 一 点 ， 先 运行 网 3-5 程 序 ， 它 从 一 个 磁盘 文件 中 将 492.6 MB 的 
数据 复制 到 另 一 个 文件 。 然 后 ， 对 比 设置 了 O_SYNC 标 志 的 程序 ， 使 


其 完成 同样 的 工作 。 在 使 用 ext4 文 件 系 统 的 Linux 上 执行 上 述 操作 ， 得 
到 的 结 来 如 图 3-13 所 示 。 


操作 用 户 CPU (s) 时 钟 时 间 Cs) 


取 自 图 3-6 中 BUFFSIZE=4 096 的 读 时 间 
正常 写 到 磁盘 文件 


设置 0_sYNC 后 写 到 磁盘 文件 

写 到 磁盘 后 接着 调用 fdatasync 

写 到 磁盘 后 接着 调用 fsync 

HEA O SYNC 后 写 到 磁盘 ， 接 着 调用 fsync 


图 3-13 在 Linux ext4 中 采用 各 种 同步 机 制 后 的 计时 结果 


图 3-13 中 的 6 行 都 是 在 BUFFSIZE 为 4 096 字 节 时 测量 的 。 图 3-6 中 的 
结果 所 测量 的 情况 是 读 一 个 人 磁盘 文件 ， 然 后 写 到 /dev/null， 所 以 没有 磁 
盘 输 出 。 图 3-13 中 的 第 2 行 对 应 于 读 一 个 磁盘 文件 ， 然 后 写 到 男 一 个 位 
盘 文 件 中 。 这 就 是 为 什么 图 3-13 中 第 1 行 与 第 2 行 有 差别 的 原因 。 在 写 磁 
盘 文 件 时 ， 系 统 时 间 增 加 了 ， 其 原因 是 内 核 需要 从 进程 中 复制 数据 ， 
并 将 数据 排 入 队列 以 便 由 磁盘 驱动 絮 将 其 写 到 磁盘 上 。 当 写 至 人 磁盘 文 
件 时 ， 我 们 期 望 时 钟 时 间 也 会 增加 。 

当 支 持 同步 写 时 ， 系 统 时 间 和 时 钟 时 间 应 当 会 显著 增加 。 但 从 第 3 
行 可 见 ， 同 步 写 所 用 的 系统 时 间 并 不 比 延 迟 写 所 用 的 时 间 增 加 很 多 。 
这 意味 着 要 么 Linux 操 作 系 统 对 延迟 写 和 同步 写 操作 的 工作 量 相 同 (这 
其 实 是 不 太 可 能 的 ) , XA O_SYNC 标志 并 没有 起 到 期 望 的 作用 。 在 
这 种 情况 下 ，Linux 操 作 系 统 并 不 允许 我 们 用 fcntl 设 置 O_SYNC 标 志 ， 
而 是 显示 失败 但 没有 返回 出 错 (但 如 果 在 文件 打开 时 能 指定 该 标志 ， 
我 们 还 是 应 该 遵 重 这 个 标志 的 ) 。 

最 后 3 行 中 的 时 钟 时 间 反 映 了 所 有 写 操 作 写 入 磁盘 时 需要 的 附加 
等 竺 时间。 同步 写 入 文件 之 后 ， 我 们 硕 望 对 fsync 的 调用 并 不 会 产生 效 
果 。 这 种 情况 理应 在 图 3-13 中 的 最 后 一 行 中 呈现 ， 但 既然 O_SYNC 标 
志 并 没有 起 到 预期 的 作用 ， 所 以 最 后 一 行 和 第 5 行 的 表现 儿 乎 相同 。 


图 3-14 显 示 了 在 采用 HFS 文 件 系 统 的 Mac OS X 10.6.8 上 运行 同样 的 
测试 得 到 的 计时 结果 。 该 计时 结果 与 我 们 的 期 望 相 符 : 同步 写 比 延迟 
写 所 消耗 的 时 间 增 加 了 很 多 ， 而 且 在 同步 写 后 再 调用 函数 fsync 并 不 产 
生 测量 结果 上 的 显著 差别 。 还 要 注意 的 是 ， 在 延迟 写 后 增加 一 个 fsync 
函数 调用 ， 测 量 结果 的 差别 也 不 大 。 其 可 能 原因 是 ， 在 向 某 个 文件 写 
入 新 数据 时 ， 操 作 系 统 已 经 将 以 前 写 入 的 数据 都 冲洗 到 了 磁盘 上 ， 所 
以 在 调用 函数 fsync 时 只 需要 做 很 少 的 工作 。 


用 户 CPU (s) 系统 CPU (s) 时 钟 时 间 Cs) 


写 到 /dev/null 
正常 写 到 磁盘 文件 


设置 0_SYNC 后 写 到 磁盘 文件 
写 到 磁盘 后 接着 调用 fsync 
KE O SYNC 后 写 到 磁盘 ， 接 着 调用 fsync 


图 3-14 在 Mac OS X HFS 中 采用 各 种 同步 机 制 后 的 计时 结果 


比较 fsync 和 fdatasync ， 两 者 都 更 新 文件 内 容 ， 用 了 O_SYNC 标 
， 每 次 写 入 文件 时 都 更 新 文件 内 容 。 每 一 种 调用 的 性 能 依赖 很 多 因 
， 包 括 底 层 的 操作 系统 实现 、 人 磁盘 驱动 器 的 速度 以 及 文件 系统 的 类 


KS A GE 


在 本 例 中 ， 我 们 看 到 了 fcnt 的 必要 性 。 我 们 的 程序 在 一 个 描述 符 
(标准 输出 ) 上 进行 操作 ， 但 是 根本 不 知道 由 shell 打 开 的 相应 文件 的 
文件 名 。 因 为 这 是 shell 打 开 的 ， 因 此 不 能 在 打开 时 按 我 们 的 要 求 设 置 
O_SYNC 标 志 。 使 用 fcnd， 我 们 只 需要 知道 打开 文件 的 描述 符 ， 就 可 以 
修改 描述 符 的 属性 。 在 讲解 非 阻 塞 管道 时 (15.28) 还 会 用 到 fcntl， 
为 对 于 管道 ， 我 们 所 知 的 只 有 其 朱 述 符 。 


3.15 ioctl 


ioctl 芳 数 一 直 是 WO 操作 的 杂 物 箱 。 不 能 用 本 划 中 其 他 函数 表示 的 
1/O 操 作 通 常 都 能 用 ioctl 表 示 。 终 端 VO 是 使 用 ioctl 最 多 的 地 方 (在 第 18 
章 中 将 看 到 ，POSIX.1 已 经 用 一 些 单独 的 函数 代替 了 终端 LO 操作 ) 。 

#include <unistd.h> /* System V */ 

#include <sys/ioctl.h> /* BSD and Linux */ 

int ioctl(int fd, int request, ...); 

返回 值 : XH, RE- Aa, AERE 

ioctl iK žit Æ Single UNIX Specification 标 准 的 一 个 扩展 部 分 ， 以 便 处 
SESTREAMSixf&[Rago 1993], 但是， 在 SUSv4 中 已 说 移 至 弃 用 状态 。 
UNIX 系 统 实现 用 它 进 行 很 多 杂项 设备 操作 。 有 些 实现 甚至 将 它 扩展 到 
用 于 普通 文件 。 

我 们 所 示 的 函数 原型 对 应 于 POSIX.1，EFreeBSD 8.0 和 Mac OS X 
10.6.8 将 第 2 个 参数 声明 为 unsigned long。 因 为 第 2 个 参数 总 是 头 文件 中 
一 个 #defined 的 名 字 ， 所 以 这 种 细节 并 没有 什么 影响 。 

对 于 ISO C 原 型 ， 它 用 省 略 号 表示 其 余 参 数 。 但 是 ， 通 常 只 有 男 外 
一 个 参数 ， 它 常常 是 指 疝 一 个 变量 或 结构 的 指针 。 

在 此 原型 中 ， 我 们 表示 的 只 是 ioctl 范 数 本 身 所 要 求 的 头 文 件 。 通 
毅 ， 还 要 求 另 外 的 设备 专用 头 文 件 。 例 如 ， 除 POSIX.1 所 说 明 的 基本 操 
作 之 外 ,终端 1O 的 ioctl 命 令 都 需要 头 文 件 <termios.h>。 

每 个 设备 驱动 程序 可 以 定义 它 自 己 专 用 的 一 组 ioctl 命令 ， 系 统 则 
为 不 同 种 类 的 设备 提供 通用 的 ioctl 命 令 。 图 3-15 中 总 结 了 FreeBSD 支 持 
的 通用 ioctl 命 令 的 一 些 类 别 。 


盘 标 号 | Dioxxx | «sys EEC h» 
X ff VO FIOxxx «sys/filio.h» 


Riu VO MTIOxxx «sys/mtio.h» 
EEF VO SIOxxx <sys/sockio.h> 
终端 IO TIOxxx «sys/ttycom.h» 


图 3-15 FreeBSD 中 通用 的 iocd 操 作 
磁 认 操作 使 我 们 可 以 在 人 磁带 上 写 一 个 文件 结束 标志 、 倒 市 、 越 过 
指定 个 数 的 文件 或 记录 等 ， AR (read ` write ` Iseek 
等 ) 都 难于 表示 这 些 操作 ， 所 以 ， 对 这 些 设备 进行 操作 最 容易 的 方法 
就是 使 用 ioctl ° 
在 18.12 节 中 将 说 明 使 用 ioctl 范 数 获取 和 设置 终端 窗口 大 小 ，19.7 方 
中 使 用 ioctl 函 数 访问 伪 终 端的 高 级 功能 


3.16 /dev/fd 


较 新 的 系统 都 提供 名 为 /devwfd 的 目录 ， 其 目录 项 是 名 为 0、1、2 
等 的 文件 。 打 开 文 件 /dev/fd/n 等 效 于 复制 描述 符 n (假定 摘 述 符 n 是 打开 
Hy) 。 

/dev/fd 这 一 功能 是 由 Tom Duff 开 发 的 ， 它 首先 出 现在 Research 
UNIX 系 统 的 第 8 版 中 ， 本 书 说 明 的 所 有 4 种 系统 (FreeBSD 8.0 ^ Linux 
3.2.0、Mac OS X 10.6.8 和 Solaris 10) 都 文 持 这 一 功能 。 它 不 是 POSIX.1 
的 组 成 部 分 

在 下 列 函 数 调用 中 : 

fd = open("/dev/fd/0", mode); 


大 多 数 系统 忽略 它 所 指定 的 mode， 而 另外 一 些 系统 则 要 求 mode 
必须 是 所 引用 的 文件 (在 这 里 是 标准 输入 ) 初始 打开 时 所 使 用 的 打开 
模式 的 一 个 子 集 。 因 为 上 面 的 打开 等 效 于 

fd = dup(0); 

所 以 描述 符 0O 和 fd 共享 同一 文件 表 项 ( 见 图 3-9) 。 例 如 ， 若 描述 符 
0 先前 被 打开 为 只 读 ， 那 么 我 们 也 只 能 对 fd 进行 读 操 作 。 即 使 系统 忽略 
打开 模式 ， 而 且 下 列 调用 是 成 功 的 : 

fd = open("/dev/fd/0", O RDWR); 

我 们 仍然 不 能 对 fd 进行 写 操作 。 

Linux 实 现 中 的 /dev/fd 是 个 例外 。 它 把 文件 搬 述 符 映 射 成 指 同 底层 
物理 文件 的 符号 链接 。 例 如 ， 当 打开 /dev/fd/0 时 ， 事 实 上 正在 打开 与 标 
准 输入 关联 的 文件 ， 因 此 返回 的 狐 文 件 描述 符 的 模式 与 /dewfd 文 件 描 述 
符 的 模式 其 实 并 不 相关 。 

我 们 也 可 以 用 /dewfd 作 为 路 径 名 参数 调用 creat， 这 与 调用 open 时 用 
O_CREAT 作 为 第 2 个 参数 作用 相同 。 例 如 ， 者 一 个 程序 调用 creat， 并 且 
路 径 名 参数 是 /devwfd/1， 那 么 该 程序 仍 能 工作 。 

注意 ， 在 Linux 上 这 么 做 必须 非常 小 心 。 因为 Linux 实 现 使 用 指向 实 
际 文件 的 符号 链接 ， 在 /devfd 文 件 上 使 用 creat 会 导致 底层 文件 被 截断 。 

某 些 系统 提供 路 径 名 /dewstdin、/devwstdout 和 /dewstderr， 这 些 等 
效 于 /dev/fd/0、/dev/fd/1 和 /dev/fd/2。 

/dev/fd 文 件 主 要 由 shell 使 用 ， 它 允许 使 用 路 径 名 作为 调用 参数 的 程 
序 ， 能 用 处 理 其 他 路 径 名 的 相同 方式 处 理 标准 输入 和 输出 。 例 如 ， 
cat(1) 命 令 对 其 命令 行 参数 采取 了 一 种 特殊 处 理 ， 它 将 单独 的 一 个 字符 
“-” 解 释 为 标准 输入 。 例 如 : 

filter file2 | cat file1 - file3 | lpr 

首先 cat 读 flel ， 接 着 读 其 标准 输入 (也 就 是 filter file2 命 令 的 输 
H) ， 然 后 读 和 亿 e3， 如 果 支 持 /dev/fd， 则 可 以 删除 cat 对 “-” 的 特殊 处 


理 ， 于 是 我 们 就 可 键入 下 列 命 令 行 : 

filter file2 | cat file1 /dev/fd/0 file3 | lpr 

作为 命令 行 参 数 的 “-” 特 指标 准 输 入 或 标准 输出 ， 这 已 由 很 多 程序 
采用 。 但 是 这 会 市 来 一 些 问 题 ， 例 如 ， 如 果 用 “-” 指 定 第 一 个 文件 ， 那 
么 看 来 束 像 指定 了 命令 行 的 一 个 选项 。/dev/fd 则 提高 了 文件 名 参数 的 一 
致 性 ， 也 更 加 清晰 。 


3.17 小 结 


本 章 说 明了 UNIX 系 统 提 供 的 基本 ORAL o Al read#ilwrite@h ÆN 
核 执行 ， 所 以 称 这 些 函 数 为 不 带 缓冲 的 IO 函数 。 在 只 使 用 read 和 write 
情况 下 ， 我 们 观察 了 不 同 的 MO 长 度 对 读 文 件 所 需 时 间 的 影响 。 我 们 也 
观察 了 许多 将 已 写 入 的 数据 冲洗 到 磁盘 上 的 方法 ， 以 及 它们 对 应 用 程 
序 性 能 的 影响 。 

在 说 明 多 个 进程 对 同一 文件 进行 追加 写 操 作 以 及 多 个 进程 创建 同 
一 文件 时 ， 本 章 介 绍 了 原子 操作 。 也 介绍 了 内 核 用 来 共享 打开 文件 信 
息 的 数据 结构 。 在 本 书 的 稍 后 还 将 涉及 这 些 数据 结构 。 

我 们 还 介绍 了 ioctl 和 fcntl 芳 数 ， 本 书后 续 部 分 还 会 涉及 这 两 个 函 
数 。 第 14 章 还 将 fcnd 用 于 记录 锁 ， 第 18 章 和 第 19 章 将 iocd 用 于 终端 设 
备 。 


习题 


3.1 当 读 / 写 磁 盘 文件 时 ， 本 章 中 描述 的 函数 确实 是 不 闪 缓 名 机 制 的 
吗 ? 请 说 明 原 因 。 


3.2 4853 — 1 -33.12 T F dup2Z] BE TH IH] RS] Ea, Be AN TRI fent ER 
数 ， 并 且 要 有 正确 的 出 错 处 理 。 

3.3 假设 一 个 进程 执行 下 面 3 个 函数 调用 : 

fd1 = open(path, oflags); 

fd2 = dup(fd1); 

fd3 = open(path, oflags); 

画 出 类 似 于 图 3-9 的 结果 图 。 对 fcntl 作 用 于 fd1 来 说 ，F_SETFD 命 令 
会 影响 哪 一 个 文件 描述 符 ? F SETFLUE? 

3.4 许多 程序 中 都 包含 下 面 一 段 代 码 : 

dup2(fd, 0); 

dup2(fd, 1); 

dup2(fd, 2); 

if (fd > 2) 

close(fd); 

为 了 说 明 if 语 名 的 必要 性 ， 假 设 fd 是 1， 画 出 每 次 调用 dup2 时 3 个 描 
述 符 项 及 相应 的 文件 表 项 的 变化 情况 。 然 后 再 画 出 fd 为 3 的 情况 。 

3.5 在 Bourne shell ^ Bourne-again shell 和 Korn shell 中 ， 
digit1>&digit2 表 示 要 将 描述 符 digit1 重 定向 至 描述 符 digit2 的 同一 文件 。 
请 说 明 下 面 两 条 命令 的 区 别 。 

/a.out > outfile 2>&1 

/a.out 2>&1 > outfile 

(提示 : shell 从 左 到 右 处 理 命令 行 。) 

3.6 如 果 使 用 追加 标志 打开 一 个 文件 以 便 恋 、 写 ， 能 否 仍 用 lseek 在 
任 一 位 置 开始 读 ? 能 否 用 lseek 更 新 文件 中 任 一 部 分 的 数据 ? 请 编写 一 
段 程序 验证 。 


上 一 半 我 们 说 明了 执行 VO 操作 的 基本 函数 ， 其 中 的 讨论 是 围绕 普 

通 文 件 UO 进 行 的 一 打开 文件 、 读 文件 或 写 文 件 。 本 章 将 描述 文件 系统 
的 其 他 特征 和 文件 的 性 质 。 我 们 将 从 stat 图 数 开始 ， 逐 个 说 明 stat 结 构 的 
每 一 个 成 员 以 了 解 文件 的 所 有 属性 。 在 此 过 程 中 ， 我 们 将 说 明 修改 这 
些 属 性 的 各 个 函数 《更 改 所 有 者 、 更 改 权限 等 ) ， 还 将 更 详细 地 说 明 
UNIX 文 件 系统 的 结构 以 及 符号 链接 。 本 章 最 后 介绍 对 目录 进行 操作 的 
各 个 范 数 ， 并 且 开 发 了 一 个 以 降序 裔 历 目录 层次 结构 的 范 数 。 


4.2 stat ^ fstat ^ fstatat*tHlstat 


本 章 主要 讨论 4 个 stat 函 数 以 及 它们 的 返回 信息 。 

#include <sys/stat.h> 

int stat(const char *restrict pathname, struct stat *restrict buf); 

int fstat(int fd, struct stat *buf); 

int Istat(const char *restrict pathname, struct stat *restrict buf); 

int fstatat(int fd, const char *restrict pathname, struct stat *restrict buf, 


int flag); 


所 有 4 个 函数 的 返回 值 : ERD; 返回 0; 看 出 销 ， 返 回 -1 

一 且 给 出 pathname ，stat 函 数 将 返回 与 此 命名 文件 有 关 的 信息 结 
构 。fstat 函 数 获 得 已 在 朱 述 符 frt 上 打开 文件 的 有 天 信 息 。lstat 函 数 类 似 
于 stat， 但 是 当 命 名 的 文件 是 一 个 符号 链接 时 ，lstat 返 回 该 符号 链接 的 
有 关 信息 ， 而 不 是 由 该 符号 链接 引用 的 文件 的 信息 。 (在 4.22 市 中 ， 当 
以 降序 所 历 目 孙 层 次 结构 时 ， 需 要 用 到 lstat。4.17 节 将 更 详细 地 说 明 符 
号 链接 。) 

fstatat 函 数 为 一 个 相对 于 当前 打开 目录 (由 fd 参数 指向 ) 的 路 径 名 
返回 文件 统计 信息 。flag 参 数控 制 着 是 否 跟随 着 一 个 符号 链接 。 当 
AT _SYMLINK_NOFOLLOW 标 志 被 设置 时 ，fstatat 不 会 跟随 符号 链接 ， 
而 是 返回 符号 链接 本 喘 的 信息 。 人 否则 ， 在 默认 情况 下 ， 返 回 的 是 符号 
链接 所 指 癌 的 实际 文件 的 信息 。 如 果 fd 参 数 的 值 是 ATL_ FDCWD ， 并 且 
pathname 人 参数 是 一 个 相对 路 径 名 ， fstatat 会 计算 相对 于 当前 目录 的 
pathname 参 数 。 如 果 pathname 是 一 个 绝对 路 径 ，fd 参 数 就 会 被 忽略 。 这 
两 种 情况 下 ， 根 据 flag 的 取 值 ，fstatat 的 作用 就 跟 stat 或 lstat 一 样 

第 2 个 参数 buf 是 一 个 指针 ， 它 指 加 一 个 我 们 必须 提供 的 结构 。 函 数 
来 填充 由 buf 指 向 的 结构 。 结 构 的 实际 定义 可 能 随 具 体 实现 有 所 不 同 ， 
但 其 基本 形式 是 : 


struct stat { 


mode t st mode; /* file type & mode 
(permissions) */ 

ino t st ino; /* j-node number (serial 
number) */ 

dev t st dev; /* device number (file 
system) */ 

dev t st rdev; /* device number for special 


files */ 


nlink t st nlink; /* number of links */ 


uid t st uid; /* user ID of owner */ 

gid t st gid; /* group ID of owner */ 

off t st size; /* size in bytes, for regular files 
mh 

struct timespec st atime; /* time of last access */ 

struct timespec st mtime; /* time of last modification */ 

struct timespec st ctime; /* time of last file status change */ 

blksize t st blksize; /* best I/O block size */ 

blkcnt t st blocks; /* number of disk blocks 
allocated */ 

is 


POSIX.17k 2 5 st_rdev ^ st_blksize #il st_blocks # EX ° Single UNIX 
Specification XSI EE X. f 3X HEF EZ ° 
timespec 结 构 类 型 按照 秒 和 纳 秒 定义 了 时 则 ， 至 少 包 括 下 面 两 个 字 


time ttv sec; 

long tv nsec; 

在 2008 年 版 以 前 的 标准 中 ， 时 间 字 段 定 义 成 st_atime、st_mtime 以 
及 st_ctime， 它 们 都 是 time_t 类 型 的 (以 秒 来 表示 ) 。timespec 结 构 提 供 
了 更 高 精度 的 时 间 戳 。 为 了 保持 兼容 性 ， 旧 的 名 字 可 以 定义 成 tv_sec 成 
员 。 例 如 ，st_atime 可 以 定义 成 st_atim.tv_sec。 

注意 ，stat 结 构 中 的 大 多 数 成 员 都 是 基本 系统 数据 类 型 ( 见 2.8 
节 ) 。 我 们 将 说 明 此 结构 的 每 个 成 员 以 了 解 文件 属性 。 

使 用 stat 函数 最 多 的 地 方 可 能 瓯 是 ls- 命令 ， 用 其 可 以 获得 有 天 
一 个 文件 的 所 有 信息 。 


4.3 型 


至 此 我 们 已 经 介绍 了 两 种 不 同 的 文件 类 型 : 普通 文件 和 目录 。 
UNIX 系统 的 大 多 数 文件 是 普通 文件 或 目 孙 ， 但 是 也 有 另外 一 些 文件 类 
型 。 文 件 类 型 包括 如 下 几 种 。 

(1) 普通 文件 (regular file) 。 这 是 最 常用 的 文件 类 型 ， 这 种 文 
件 包含 了 某 种 形式 的 数据 。 至 于 这 种 数据 是 文本 还 是 二 进 制 数 据 ， 对 
于 UNIX 内 核 而 言 并 无 区 别 。 对 普通 文件 内 容 的 解释 由 处 理 该 文件 的 应 
用 程序 进行 。 

个 值得 注意 的 例外 是 二 进 制 可 执行 文件 。 为 了 执行 程序 ， 内 核 
必须 理解 其 格式 。 所 有 二 进 制 可 执行 文件 都 遵循 一 种 标准 化 的 格式 ， 
这 种 格式 使 内 核能 够 确定 程序 文本 和 数据 的 加 载 位 置 。 

(2) 目录 文件 (directory file) 。 这 种 文件 包含 了 其 他 文件 的 名 字 
以 及 指 疝 与 这 些 文 件 有 关 信 息 的 指针 。 对 一 个 目录 文件 具有 读 权限 的 
任 一 进程 都 可 以 读 该 目录 的 内 容 ， 但 只 有 内 核 可 以 直接 写 目 录 文 件 。 
进程 必须 使 用 本 章 介绍 的 函数 才能 更 改 目 录 。 

(3) 块 特殊 文件 (block special file) 。 这 种 类 型 的 文件 提供 对 设 
备 (如 磁盘 ) 带 缓冲 的 访问 ， 每 次 访问 以 固定 长 度 为 单位 进行 。 

注意 ，FreeBSD 不 再 支持 块 特殊 文件 。 对 设备 的 所 有 访问 需要 通过 
字符 特殊 文件 进行 。 

(4) 字符 特殊 文件 (character special file) 。 这 种 类 型 的 文件 提供 
对 设备 不 带 缓冲 的 访问 ， 每 次 访问 长 度 可 变 。 系 统 中 的 所 有 设备 要 公 
是 字符 特殊 文件 ， 要 么 是 块 特殊 文件 。 

(5) FIFO。 这 种 类 型 的 文件 用 于 进程 间 通 信 ， 有 时 也 称 为 命名 管 
道 (named pipe) 。15.5 节 将 对 其 进行 说 明 。 


(6) BÈF (socket) 。 这 种 类 型 的 文件 用 于 进程 间 的 网 络 通 
言 。 套 接 字 也 可 用 于 在 一 台 宿 主机 上 进程 之 间 的 非 网 络 通信 。 第 16 章 
将 用 套 接 字 进 行进 程 间 的 通信 。 
(7) 符号 链接 (symbolic link) 。 这 种 类 型 的 文件 指向 另 一 个 文 
件 。4.17 节 将 更 多 地 描述 符号 链接 。 
文件 类 型 信息 包含 在 stat 结 构 的 st_mode 成 员 中 。 可 以 用 图 4-1 中 的 
宏 确 定 文 件 类 型 。 这 些 宏 的 参数 都 是 stat 结 构 中 的 st_mode 成 员 。 


普通 文件 


= 


S_ISREG 


S ISCHR 字符 特殊 文件 
S ISBLK( 块 特殊 文件 

S ISFIFO() 管道 或 FIFO 
S ISLNK() 符号 链接 

S ISSOCK() Win f 


() 

S ISDIR() 目录 文件 
() 
) 


图 4-1 在 <sys/stat.h> 中 的 文件 类 型 宏 

POSIX.1 人 允许 实现 将 进程 间 通 信 (IPC) WR (如 消息 队列 和 信号 
量 等 ) 说 明 为 文件 。 图 4-2 中 的 宏 可 用 来 从 stat 结构 中 确定 IPC 对 象 的 
类 型 。 这 些 宏 与 图 4-1 中 的 不 同 ， 它 们 的 参数 并 非 st_mode， 而 是 指 癌 
stat 结 构 的 指针 。 


对 象 的 类 型 


S TYPEISMO() 
S TYPEISSEM () 
S TYPEISSHM() 


图 4-2 在 <sys/stat.h> 中 的 IPC 类 型 宏 


消息 队列 、 信 号 量 以 及 共享 存储 对 象 等 将 在 第 15 章 中 讨论 。 但 
是 ， 本 书 讨论 的 4 种 UNIX 系 统 都 不 将 这 些 对 象 表 示 为 文件 。 

实例 

图 4-3 程 序 取 其 命令 行 参数 ， 然 后 针对 每 一 个 命令 行 参数 打印 其 文 
件 类 型 。 


x 


#include "apue.h" 


int 
main(int argc, char *argv[]) 
{ 

int ae; 

struct stat buf; 

char *ptr; 


for (1 = li i € argc; Ttt) 4 
printf("$s: ", argv[il); 
if (lstat(argv[i], &buf) < 0) A 
err ret("lstat error"); 
continue; 
) 
if (S ISREG(buf.st mode)) 


ptr - "regular"; [ 9 

else if (S ISDIR(buf.st mode)) 
ptr - "directory"; 

else if (S ISCHR(buf.st mode)) 
ptr = "character special"; 

else if (S ISBLK(buf.st mode)) 
ptr = "block special"; 

else if (S ISFIFO(buf.st mode)) 
ptr - "fifo"; 

else if (S ISLNK(buf.st mode)) 
ptr - "symbolic link"; 

else if (S ISSOCK(buf.st mode)) 
ptr = "socket"; 

else 
ptr = "** unknown mode **"; 


printf("ssWin", per)? 
} 
exit (0); 


图 4-3 对 每 个 命令 行 参数 打印 文件 类 型 


图 4-3 程 序 的 示例 输出 是 : 
$ ./a.out /etc/passwd /etc /dev/log /dev/tty \ 


> /var/lib/oprofile/opd pipe /dev/srO /dev/cdrom 

/etc/passwd: regular 

/etc: directory 

/dev/log: socket 

/dev/tty: character special 

/var/lib/oprofile/opd pipe: fifo 

/dev/sr0: block special 

/dev/cdrom: symbolic link 

(其 中 ， 在 第 一 个 命令 行 末 端 我 们 键入 了 一 个 反 斜 枉 ， 通 知 shell 

要 在 下 一 行 继续 键入 命令 ， 然 后 ， shell 在 下 一 行 上 用 其 辅助 提示 符 > 提 


示 我 们 。) 我 们 特地 使 用 了 lstat 芳 数 而 不 是 stat 芳 数 以 便 检 测 符 号 链 
feo Ua istae, WU ADESSET BEBE © 

早期 的 UNIX 版 本 并 不 提供 S_ISxxx 宏 ， 于 是 就 需要 将 st_mode 与 屏 
蔽 了 字 S_IFMT 进 行 逻辑 “与 运算， 然后 与 名 为 S_IFxxx 的 常量 相 比 较 。 大 
多 数 系统 在 文件 <sys/stat.h> 中 定义 了 此 屏蔽 字 和 相关 的 常量 。 如 若 查 看 
此 文件 ， 则 可 找到 S_ISDIR 宏 定义 为 : 

#define S_ISDIR (mode) (((mode) & S_IFMT) == S IFDIR) 

我 们 说 过 ， 普 通 文件 是 最 主要 的 文件 类 型 ， 但 是 观察 一 下 在 一 个 
给 定 的 系统 中 各 种 文件 的 比例 是 很 有 意思 的 。 图 4-4 显 示 了 在 一 个 单 用 
户 工作 站 Linux 系 统 中 的 统计 值 和 百分比 。 这 些 数据 是 由 4.22 世 中 的 程 
序 得 到 的 。 


文件 类 型 统计 值 百分比 (99) 


普通 文件 415 803 
目录 62 197 
符号 链接 40 018 


字符 特殊 155 
块 特殊 47 
ERT 

FIFO 


图 4-4 不 同类 型 文件 的 统计 值 和 百分比 


4.4 设置 用 户 ID 和 设置 组 ID 


与 一 个 进程 相关 联 的 ID 有 6 个 或 更 多 ， 如 图 4-5 所 示 。 


实际 用 户 ID 
实际 组 ID 
有 效用 户 ID 


我 们 实际 上 是 谁 


有 效 组 ID 用 于 文件 访问 权限 检查 
附属 组 ID 

保存 的 设置 用 户 ID 

保存 的 设置 组 ID 


由 exec 函数 保存 


图 4-5 与 每 个 进程 相关 联 的 用 户 ID 和 组 ID 

“实际 用 户 ID 和 实际 组 ID 标识 我 们 究竟 是 谁 。 这 两 个 字段 在 登录 时 
取 自 口令 文件 中 的 登录 项 。 通 常 ， 在 一 个 登录 会 话 期 间 这 些 值 并 不 改 
45. 但 是 超级 用 户 进 程 有 方法 改变 它们 ，8.11 节 将 说 明 这 些 方法 。 

“有 效用 户 ID、 有 效 组 DD 以 及 附属 组 ID 决 是 了 我 们 的 文件 访问 权 
限 ， 下 一 节 将 对 此 进行 说 明 (我 们 已 在 1.8 节 中 说 明了 附属 组 ID) 。 

“保存 的 设置 用 户 ID 和 保存 的 设置 组 ID 在 执行 一 个 程序 时 包含 了 有 
效用 户 ID 和 有 效 组 ID 的 副本 ， 在 8.11 节 中 说 明 setuid 函 数 时 ， 将 说 明 这 
两 个 保存 值 的 作用 。 

在 POSIX.1 2001 年 版 中 ， 要 求 这 些 保存 的 ID。 在 早期 POSIX 版 本 
中 ， 它 们 是 可 选 的 。 一 个 应 用 程序 在 编译 时 可 测试 常量 
_POSIX_SAVED_IDS， 或 在 运行 时 以 参数 _SC_SAVED_IDS 调 用 函数 
sysconf， 以 判断 此 实现 是 否 支 持 这 一 功能 。 

通常 ， 有 效用 户 ID 等 于 实际 用 户 ID ， 有 效 组 ID 等 于 实际 组 ID © 

每 个 文件 有 一 个 所 有 者 和 组 所 有 者 ， 所 有 者 由 stat 结 构 中 的 st_uid 指 
定 ， 组 所 有 者 则 由 st_gid 指 定 。 

当 执 行 一 个 程序 文件 时 ， 进 程 的 有 效用 户 ID 通常 就 是 实际 用 户 
ID， 有 效 组 ID 通常 是 实际 组 ID。 但 是 可 以 在 文件 模式 字 (st mode) 中 
设置 一 个 特殊 标志 ， 其 含义 是 “ 当 执行 此 文件 时 ， 将 进程 的 有 效用 户 ID 
设置 为 文件 所 有 者 的 用 户 ID (st uid) ”。 与 此 相 类 似 ， 在 文件 模式 字 
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组 所 有 者 ID (st_gid) 。 在 文件 模式 字 中 的 这 两 位 被 称 为 设置 用 户 ID 
(set-user-ID) 位 和 设置 组 ID (set-group-ID) 位 。 
例如 ， 若 文件 所 有 痢 是 超级 用 户 ， 而 且 设 置 了 该 文件 的 设置 用 户 
ID 位 ， 那 么 当 该 程序 文件 由 一 个 进程 执行 时 ， 该 进程 具有 超级 用 户 权 
限 。 不 管 执 行 此 文件 的 进程 的 实际 用 户 ID 是 什么 ， 都 会 是 这 样 。 例 
"ll, UNIX 系统 程序 passwd(1) 人 允许 任 一 用 户 改变 其 口令 ， 该 程序 是 一 个 
设置 用 户 ID 程序 。 因 为 该 程序 应 能 将 用 户 的 新 口令 写 入 口令 文件 中 
(一 般 是 /etc/passwd 或 /etc/shadow) ， 而 只 有 超级 用 户 才 具有 对 该 文件 
的 写 权 限 ， 所 以 需要 使 用 设置 用 户 ID 功能 。 因 为 运行 设置 用 户 ID 程序 
的 进程 通常 会 得 到 额外 的 权限 ， 所 以 编写 这 种 程序 时 要 特别 谍 愤 。 第 8 
章 将 更 详细 地 讨论 这 种 类 型 的 程序 。 
再 回 到 stat 函 数 ， 设 置 用 户 ID 位 及 设置 组 ID 位 都 包含 在 文件 的 
st_mode 值 中 。 这 两 位 可 分 别 用 常量 S_ISUID 和 S_ISGID 测 试 。 


4.5 yj jH 


st_mode 值 也 包含 了 对 文件 的 访问 权限 位 。 当 提 及 文件 时 ， 指 的 是 
前 面 所 提 到 的 任何 类 型 的 文件 。 所 有 文件 类 型 (目录 、 字 符 特 别 文件 
等 ) 都 有 访问 权限 (access permission) 。 很 多 人 认为 只 有 普通 文件 有 
访问 权限 ， 这 是 一 种 误解 。 

每 个 文件 有 9 个 访问 权限 位 ， 可 将 它们 分 成 3 类 ， 见 图 4-6。 


S IRUSR 
S IWUSR 
S IXUSR 
S IRGRP 组 读 


S_IWGRP 组 写 
S_IXGRP 组 执行 
S_IROTH 其 他 读 
S_IWOTH 其 他 和 写 

S IXOTH 其 他 执行 


图 4-6 9 个 访问 权限 位 ， 取 自 <sys/stat.h> 


在 图 4-6 前 3 行 中 ， 术 语 用 户 指 的 是 文件 所 有 者 (owner) 

chmod(1) 命 令 用 于 修改 这 9 个 权限 位 。 该 命令 允许 我 们 用 u 表 示 用 户 

(SUED ， 用 g 表 示 组 ， 用 o 表 示 其 他 。 有 些 书 把 这 3 种 用 户 类 型 分 别 
称 为 所 有 者 、 组 和 世界 。 这 会 造成 混乱 ， 因 为 chmod 命令 用 o 表 示 其 
他 ， 而 不 是 所 有 者 。 我 们 将 使 用 术语 用 户 、 组 和 其 他 ， 以 便 与 chmod 命 
令 保持 一 致 。 

图 4-6 中 的 3 类 访问 权限 ( 即 读 、 写 及 执行 ) 以 各 种 方式 由 不 同 的 函 
数 使 用 。 我 们 将 这 些 不 同 的 使 用 方式 汇总 在 下 面 。 当 说 明 相 天 函数 
时 ， 再 进一步 讨论 。 

“第 一 个 规则 是 ， 我 们 用 名 字 打 开 任 一 类 型 的 文件 时 ， 对 该 名 字 中 
包含 的 每 一 个 目录 ， 包 括 它 可 能 隐 舍 的 当前 工作 目录 都 应 具有 执行 权 
限 。 这 就 是 为 什么 对 于 目录 其 执行 权限 位 常 被 称 为 搜索 位 的 原因 。 

例如 ， 为 了 打开 文件 /usr/include/stdio.h ， 需 要 对 目录 /、 /usr 
和 Amsrinclude 具 有 执行 权限 。 然 后 ， 需 要 具有 对 文件 本 身 的 适当 权限 ， 


这 取决 于 以 何 种 模式 打开 它 (HEC WES) 。 

如 果 当 前 目录 是 /usr/include， 那 么 为 了 打开 文件 stdio.h， 需 要 对 当 
前 目录 有 执行 权限 。 这 是 隐 含 当前 目录 的 一 个 示例 。 打 开 stdio.h 文 件 与 
打开 ./stdio.h 作 用 相同 。 注 意 ， 对 于 目录 的 读 权 限 和 执行 权限 的 意义 是 
不 相同 的 。 读 权限 允许 我 们 读 目 隶 ， 获 得 在 该 目录 中 所 有 文件 名 的 列 
表 。 当 一 个 目录 是 我 们 要 访问 文件 的 路 径 名 的 一 个 组 成 部 分 时 ， 对 该 
目录 的 执行 权限 使 我 们 可 通过 该 目录 〈 也 就 是 搜索 该 目 未 ， 寻 找 一 个 
特定 的 文件 名 ) 。 引 用 隐 含 目 孙 的 另 一 个 例子 是 ， 如 果 PATH 环 境 变量 
(8.10 节 将 对 其 进行 说 明 ) 指定 了 一 个 我 们 不 具有 执行 权限 的 目录 ， 那 
么 shell 绝 不 会 在 该 目录 下 找到 可 执行 文件 。 

对 于 一 个 文件 的 读 权限 决定 了 我 们 是 否 能 够 打开 现 有 文件 进行 读 
操作 。 这 与 open 画 数 的 O_RDONLY 和 O_RDWR 标志 相关 。 

对 于 一 个 文件 的 写 权 限 决定 了 我 们 是 否 能 够 打开 现 有 文件 进行 写 
操作 。 这 与 open 画 数 的 O_WRONLY 和 O_RDWR 标志 相关 。 

为 了 在 open 函 数 中 对 一 个 文件 指定 O_TRUNC 标 志 ， 必 须 对 该 文 
件 具 有 写 权 限 。 

为 了 在 一 个 目录 中 创建 一 个 新 文件 ， 必 须 对 该 目录 具有 写 权 限 和 
执行 权限 。 

为 了 删除 一 个 现 有 文件 ， 必 须 对 包含 该 文件 的 目录 具有 写 权 限 和 
执行 权限 。 对 该 文件 本 身 则 不 需要 有 读 、 写 权限 。 

“如 果 用 7 个 exec 函 数 (558.1075). 中 的 任何 一 个 执行 某 个 文件 ， 都 
必须 对 该 文件 具有 执行 权限 。 该 文件 还 必须 是 一 个 普通 文件 。 

进程 每 次 打开 、 创 建 或 删除 一 个 文件 时 ， 内 核 就 进行 文件 访问 权 
限 测试 ， 而 这 种 测试 可 能 涉及 文件 的 所 有 者 (st_uid 和 st_gid) 、 进 程 
的 有 效 ID 〈 有 效用 户 ID 和 有 效 组 ID) 以 及 进程 的 附属 组 ID 〈 若 支持 的 
W) 。 两 个 所 有 者 ID 是 文件 的 性 质 ， 而 两 个 有 效 D 和 附属 组 ID 则 是 进 
程 的 性 质 。 内 核 进 行 的 测试 具体 如 下 。 


(1) 若 进 程 的 有 效用 户 ID 是 0 (超级 用 户 ) ， 则 允许 访问 。 这 给 
予 了 超级 用 户 对 整个 文件 系统 进行 处 理 的 最 充分 的 自由 。 

(2) 若 进 程 的 有 效用 户 ID 等 于 文件 的 所 有 者 ID (也 就 是 进程 拥有 
此 文件 ) ， 那 么 如 果 所 有 者 适当 的 访问 权限 位 被 设置 ， 则 允许 访问 ; 
否则 拒绝 访问 。 适 当 的 访问 权限 位 指 的 是 ， 若 进程 为 读 而 打开 该 文 
件 ， 则 用 户 读 位 应 为 1; 若 进 程 为 写 而 打开 该 文件 ， 则 用 户 写 位 应 为 
1; 若 进 程 将 执行 该 文件 ， 则 用 户 执行 位 应 为 1。 

(3) 若 进 程 的 有 效 组 ID 或 进程 的 附属 组 人 DD 之 一 等 于 文件 的 组 ID， 
那么 如 果 组 适当 的 访问 权限 位 被 设置 ， 则 允许 访问 ， 否 则 拒绝 访问 。 

(4) 若 其 他 用 户 适 当 的 访问 权限 位 被 设置 ， 则 允许 访问 ， 否 则 拒 
绝 访 问 。 

按 顺序 执行 这 4 步 。 注 意 ， 如 果 进 程 拥有 此 文件 (第 2 步 ) ， 则 
按 用 户 访 问 权 限 批准 或 拒绝 该 进程 对 文件 的 访问 一 不 查看 组 访问 权 
限 。 类 似 地 ， 若 进程 并 不 拥有 该 文件 。 但 进程 属于 某 个 适当 的 组 ， 则 
按 组 访问 权限 批准 或 拒绝 该 进程 对 文件 的 访问 一 不 查看 其 他 用 户 的 访 
问 权限 。 


4.6 . 


在 第 3 章 中 讲述 用 open 或 creat 创 建新 文件 时 ， 我 们 并 没有 说 明 赋予 
新 文件 的 用 户 ID 和 组 ID 是 什么 。4.21 节 将 说 明 mkdir 函 数 ， 此 时 就 会 了 
解 如 何 创建 一 个 新 目录 。 关 于 新 目录 的 所 有 权 规 则 与 本 节 将 说 明 的 新 
文件 所 有 权 规 则 相同 。 

新 文件 的 用 户 ID 设 置 为 进程 的 有 效用 户 ID。 关 于 组 ID，POSIX.1 人 允 
许 实现 选择 下 列 之 一 作为 新 文件 的 组 ID 。 

(1) 新 文件 的 组 ID 可 以 是 进程 的 有 效 组 ID 。 


(2) 新 文件 的 组 ID 可 以 是 它 所 在 目录 的 组 ID © 

FreeBSD 8.0 和 Mac OS X 10.6.8 总 是 使 用 目录 的 组 ID 作为 新 文件 的 
组 ID。 有 些 Linux 文 件 系统 使 用 mount(1) 命 令 选 项 允许 在 POSIX.1 提出 
的 两 种 选项 中 进行 选择 。 对 于 Linux 3.2.0 和 Solaris 10， 默 认 情 况 下 ， 
新 文件 的 组 ID 取决 于 它 所 在 的 目录 的 设置 组 ID 位 是 否 被 设置 。 如 果 该 
目录 的 这 一 位 已 经 被 设置 ， 则 新 文件 的 组 ID 设 置 为 目录 的 组 ID; 否则 
新 文件 的 组 ID 设置 为 进程 的 有 效 组 ID 。 

使 用 POSIX.1 所 允许 的 第 二 个 选项 (继承 目录 的 组 ID) 使 得 在 某 个 
目录 下 创建 的 文件 和 目录 都 具有 该 目录 的 组 ID。 于 是 文件 和 目录 的 组 
所 有 权 从 该 点 问 下 传递 。 例 如 ， 在 Linux 的 /var/mail 目 隶 中 就 使 用 了 这 
种 方法 。 

正如 前 面 提 到 的 ， 这 种 设置 组 所 有 权 的 方法 是 FreeBSD 8.0 和 Mac 
OS X 10.6.8 系 统 默 认 的 ， 但 对 于 Linux 和 Solaris 则 是 可 选 的 。 在 Linux 
3.2.0 和 Solaris 10.2 下， 必须 使 设置 组 ID 位 起 作用 。 更 进一步 ， 为 使 这 
种 方法 能 够 正常 工作 ，mkdir 画 数 要 上 自动 地 传递 一 个 目录 的 设置 组 ID 位 

(4.21 节 将 说 明 mkdir 就 是 这 样 做 的 ) 。 


4.7 accessAlfaccessat 


正如 前 面 所 说 ， 当 用 open 函数 打开 一 个 文件 时 ， 内 核 以 进程 的 有 
效用 户 ID 和 有 将 组 有 DD 为 基础 执行 其 访问 权限 测试 。 有 时 ， 进 程 也 希望 
按 其 实际 用 户 ID 和 实际 组 ID 来 测试 其 访问 能 力 。 例 如 ， 当 一 个 进程 使 
用 设置 用 户 ID 或 设置 组 ID 功能 作为 另 一 个 用 户 (或 组 ) 运行 时 ， 就 可 
能 会 有 这 种 需要 。 即 使 一 个 进程 可 能 已 经 通过 设置 用 户 ID 以 超级 用 户 
权限 运行 ， 它 仍 可 能 想 验 证 其 实际 用 户 能 否 访问 一 个 给 定 的 文件 。 
access F} faccessat EX 2 Ze 1: Sz [s H P? ID NI SE ERZH ID 3E £7 73 IBY AN BR ak, 


的 。 (该 测试 也 分 成 4 步 ， 这 与 4.5 节 中 所 壕 的 一 样 ， 但 将 有 效 改 为 实 
际 。) 
#include <unistd.h> 
int access(const char *pathname, int mode); 
int faccessat(int fd, const char *pathname, int mode, int flag); 
两 个 函数 的 返回 值 : TERR), GRIGIO; 看 出错， 返回 -1 
其 中 ， 如 采 测 试 文件 是 否 已 经 存在 ，mode 就 为 FE_OK; 否则 mode 


征 几 4-7 中 所 列 币 量 的 按 位 或 。 


R OK 测试 读 权 限 


W OK 测试 写 权 限 
x OK 测试 执行 权限 


图 4-7 access 函 数 的 mode 标 志 ， 取 自 <unistd.h> 


faccessat 芳 数 与 access 函 数 在 下 面 两 种 情况 下 是 相同 的 : 一 种 是 
pathname 参 数 为 绝对 路 径 ， 男 一 种 是 fd 参数 取 值 为 AT_FDCWD 而 
pathname 参 数 为 相对 路 径 。 否 则 ，faccessat 计 算 相 对 于 打开 目录 (由 fd 
参数 指向 ) 的 pathname » 

flag 参 数 可 以 用 于 改变 faccessat 的 行为 ， 如 果 flag 设 置 为 
AT EACCESS, 访问 检查 用 的 是 调用 进程 的 有 效用 户 人 D 和 有 效 组 ID， 
而 不 是 实际 用 户 ID 和 实际 组 ID。 

实例 

图 4-8 显 示 了 access 函 数 的 使 用 方法 。 


#include "apue.h" 
#include <fcntl.h> 


int 
main(int argc, char *argv[]) 
{ 
if (argc != 2) 
err quit("usage: a.out <pathname>") ; 
if (access(argv[1], R_OK) < 0) 
err ret("access error for %s", argv[1]); 
else 
printf("read access OK\n"); 
if (open(argv[1], O RDONLY) « 0) 
err ret("open error for %s", argv[1]); 
else 
printf("open for reading OK\n"); 
exit (0); 


下 面 是 该 程序 的 示例 会 话 : 

$ Is -l a.out 

-TWXIWXI-X 1 sar 15945 Nov 30 12:10 a.out 
$ ./a.out a.out 

read access OK 

open for reading OK 

$ Is -l /etc/shadow 

-[-------- 1 root 1315 Jul 17 2002 /etc/shadow 


图 4-8 access EK ANSE Hl] 


$ ./a.out /etc/shadow 
access error for /etc/shadow: Permission denied 


open error for /etc/shadow: Permission denied 


$ su 成 为 超级 用 户 
Password: 输入 超级 用 户口 令 
# chown root a.out 将 文件 用 户 ID 改 为 root 
# chmod u+s a.out 并 打开 设置 用 户 ID 位 


# ls -l a.out 检查 所 有 者 和 SUID 位 


-rwsrwxr-x 1 root 15945 Nov 30 12:10 a.out 

# exit 恢复 为 正常 用 户 

$ ./a.out /etc/shadow 

access error for /etc/shadow: Permission denied 

open for reading OK 

在 本 例 中 ， 尽 管 open 函 数 能 打开 文件 ， 但 通过 设置 用 户 ID 程序 可 
以 确定 实际 用 户 不 能 正常 读 指定 的 文件 。 

在 上 例 及 第 8 章 中 ， 我 们 有 时 要 成 为 超级 用 户 ， 以 便 演 示 某 些 功能 
是 如 何 工 作 的 。 如 果 你 使 用 多 用 户 系统 ， 但 无 超级 用 户 权 限 ， 那 么 你 
就 不 能 完整 地 重复 这 些 实例 。 


4.8 umask 


至 此 我 们 已 说 明了 与 每 个 文件 相关 联 的 9 个 访问 权限 位 ， 在 此 基础 
上 我 们 可 以 说 明 与 每 个 进程 相关 联 的 文件 模式 创建 屏蔽 字 。 

umask 函数 为 进程 设置 文件 模式 创建 屏蔽 字 ， 并 返回 之 前 的 值 。 

(这 是 少数 儿 个 没有 出 错 返回 函数 中 的 一 个 。) 
#include <sys/stat.h> 
mode t umask(mode t cmask); 
REME: 之 前 的 文件 模式 创建 屏蔽 字 

其 中 ， 参 数 cmask 是 由 图 4-6 中 列 出 的 9 个 常量 (S IRUSR ` 
S_IWUSR 等 ) 中 的 若干 个 按 位 “或 "构成 的 。 

在 进程 创建 一 个 新 文件 或 新 目录 时 ， 就 一 定 会 使 用 文件 模式 创建 
ERF (回忆 3.3 A 3.4 和 ， 在 那里 我 们 说 明了 open 和 creat 函 数 。 这 
两 个 函数 都 有 一 个 参数 mode， 它 指定 了 新 文件 的 访问 权限 位 ) 。 我 们 


将 在 4.21 市 说 明 如 何 创建 一 个 新 目录 。 在 文件 模式 创建 屏蔽 字 中 为 1 的 


pis 


在 文件 mode 中 的 相应 位 一 定 被 关闭 。 
实例 
图 4-9 程 序 创建 了 两 个 文件 ， 创 建 第 一 个 时 ，umask 值 为 0， 创 建 


二 个 时 ，umask 值 禁止 所 有 组 和 其 他 用 户 的 访问 权限 。 


#include "apue.h" 
#include <fcntl.h> 


#define RWRWRW (S IRUSR|S IWUSR|S IRGRP|S IWGRP|S IROTH|S IWOTH) 


int 


main (void) 


( 


umask (0) ; 
if (creat("foo", RWRWRW) < 0) 

err_sys("creat error for foo"); 
umask(S_IRGRP | S IWGRP | S IROTH | S IWOTH) ; 
if (creat("bar", RWRWRW) < 0) 
err_sys("creat error for bar"); 
exit (0); 


的 。 


时 ， 


图 4-9 umask KE i] 

若 运 行 此 程序 可 得 如 下 结果 ， 从 中 可 见 访问 权限 位 是 如 何 设置 
$ umask 先 打 印 当 前 文件 模式 创建 屏蔽 字 
-TW------- 1 sar 0 Dec 7 21:20 bar 
-IW-rW-rw- 1 sar 0 Dec 7 21:20 foo 
002 
$ /a.out 
$ Is -1 foo bar 
$ umask 观察 文件 模式 创建 屏蔽 字 是 否 更 改 
002 


UNIX 系 统 的 大 多 数 用 户 从 不 处 理 他 们 的 umask 值 。 通 第 在 登 孙 
由 shell 的 局 动 文件 设置 一 次 ， 然 后 ， 再 不 改变 。 尽 管 如 此 ， 当 编 


写 创 建新 文件 的 程序 时 ， 如 有 果 我 们 想 确保 指定 的 访问 权限 位 已 经 激 
活 ， 那 么 必须 在 进程 运行 时 修改 umask 值 。 例 如 ， 如 果 我 们 想 确保 任 
何 用 户 都 能 读 文 件 ， 则 应 将 umask 设 置 为 0。 否则 ， 当 我 们 的 进程 运行 
上 时， 有 效 的 umask 值 可 能 关闭 该 权限 位 。 

在 前 面 的 示例 中 ， 我 们 用 shell 的 umask 命 令 在 运行 程序 的 前 、 后 打 
印 文件 模式 创建 屏蔽 字 。 从 中 可 见 ， 更 改进 程 的 文件 模式 创建 屏蔽 字 
并 不 影响 其 父 进程 (常常 是 shell) 的 屏蔽 字 。 所 有 shell 都 有 内 置 umask 
命令 ， 我 们 可 以 用 该 命令 设置 或 打印 当前 文件 模式 创建 屏蔽 字 。 

用 户 可 以 设置 umask 值 以 控制 他 们 所 创建 文件 的 默认 权限 。 该 值 表 
示 成 八进制 数 ， 一 位 代表 一 种 要 屏蔽 的 权限 ， 这 示 于 图 4-10 中 。 设 置 了 
相应 位 后 ， 它 所 对 应 的 权限 束 会 彼 拒 绝 。 常 用 的 几 种 umask 值 是 002 ` 
022 和 027。002 阻止 其 他 用 户 写 入 你 的 文件 ，022 阻止 同 组 成 员 和 其 
他 用 户 写 入 你 的 文件 ，027 阻 止 同 组 成 员 写 你 的 文件 以 及 其 他 用 户 读 、 
写 或 执行 你 的 文件 。 


用 户 读 
用 户 写 
用 户 执行 


组 读 


组 写 
组 执行 
其 他 读 
其 他 与 
其 他 执行 


图 4-10 umask 文 件 访问 权限 位 


Single UNIX Specification 要求 shell 应 该 文 持 符号 形式 的 umask 命 
令 。 与 八进制 格式 不 同 ， 符 号 格式 指定 许可 的 权限 ( 即 在 文件 创建 屏 
WEP AON ft) 而 非 拒 绝 的 权限 ( 即 在 文件 创建 屏蔽 字 中 为 1 的 
fr) 。 下 面 显示 了 两 种 格式 的 命令 。 


$ umask 完 打 印 当 前 文件 模式 创建 屏蔽 
字 

$umask -S 打印 符号 格式 

$umask 027 更 改 文件 模式 创建 屏蔽 字 

$umask -S 打印 符号 格式 

002 


U=TWX,g=TWX,O=TX 


U=TWX,g=IX,O= 


4.9 chmod ^ fchmodZlifchmodat 


chmod、fchmod 和 fchmodat 这 3 个 函数 使 我 们 可 以 更 改 现 有 文件 的 
访问 权限 。 

#include <sys/stat.h> 

int chmod(const char *pathname, mode_t mode); 

int fchmod(int fd, mode_t mode); 

int fchmodat(int fd, const char *pathname, mode_t mode, int flag); 

3 个 函数 返回 值 : 者 成 功 ， 返 回 0; 看 出 错 ， 返 回 -1 

chmod 函数 在 指定 的 文件 上 进行 操作 ， 而 fchmod 函数 则 对 已 打开 
的 文件 进行 操作 。fchmodat 函 数 与 chmod 函 数 在 下 面 两 种 情况 下 是 相同 
Hy: 一 种 是 pathname 参 数 为 绝对 路 人 径 ， 男 一 种 是 fd 参数 取 值 为 
AI FDCWD 而 pathname 参 数 为 相对 路 径 。 人 否则 ，fchmodat 计 算 相 对 于 


打开 目录 (由 fd 参数 指向 ) A pathname ° flag & Zt nf LL Fi F EP 
fchmodat 的 行为 ， 当 设置 了 AT SYMLINK NOFOLLOW fj x& FY , 


fchmodat 并 不 会 跟随 符号 链接 。 


为 了 改变 一 个 文件 的 权限 位 ， 进 程 的 有 效用 户 ID 必须 等 于 文件 的 
所 有 者 ID ， 或 者 该 进程 必须 具有 超级 用 户 权 限 。 
参数 mode 是 图 4-11 中 所 示 闸 量 的 按 位 或 。 


S ISUID 
S ISGID 
So ISVIX 


S IRWXU 


S IRUSR 
S IWUSR 


S IXUSR 
S IRWXG 

S IRGRP 

S IWGRP 

S IXGRP 
S IRWXO 

S IROTH 

S IWOTH 

S IXOTH 


执行 时 设置 用 户 ID 
执行 时 设置 组 ID 
保存 正文 〈 粘 着 位 ) 
用 户 (所 有 者 ) 读 、 写 和 执 
行 

用 户 ( 所 有 者 ) 读 
用 户 ( 所 有 者 ) 5 
HP AZ) 执行 
组 读 、 写 和 执行 
组 读 

组 写 

组 执行 

其 他 读 、 

其 他 读 

其 他 写 

其 他 执行 


图 4-11 chmod 函 数 的 mode 常 量 ， 取 自 <sys/stat.h> 


注意 ， 在 图 4-11 中 ， 有 9 项 是 取 目 图 4-6 中 的 9 个 文件 访问 权限 位 。 
我 们 另外 加 了 6 人 个， 它们 是 两 个 设置 ID 常量 (S_ISUID 和 S_ISGID) ^ 
保存 正文 常量 (SISVTX) 以 及 3 个 组 合 常 量 (S IRWXU ^ S IRWXG 
和 S_IRWXO) 。 

保存 正文 位 (S ISVTX) 不 是 POSIX.1 的 一 部 分 。 在 Single UNIX 
Specification 中 ， 它 被 定义 在 XSI 扩 展 中 。 我 们 在 下 一 世 说 明 其 目的 。 

实例 

为 了 演示 umask 函 数 ， 我 们 在 前 面 运 行 了 图 4-9 程 序 ， 移 让 我 们 回 
忆 文 件 foo 和 bar 当 时 的 最 后 状态 : 

$ Is -] foo bar 

-IW------- 1 sar 0 Dec 7 21:20 bar 

-rw-rw-rw- 1 sar 0 Dec 7 21:20 foo 


图 4-12 的 程序 修改 了 这 两 个 文件 的 模式 。 


#include "apue.h" 


int 
main (void) 
{ 
struct stat statbuf; 


/* turn on set-group-ID and turn off group-execute */ 


if (stat("foo", &statbuf) « 0) 
err sys("stat error for foo"); 

if (chmod("foo", (statbuf.st mode & -S IXGRP) | S ISGID) « 0) 
err sys("chmod error for foo"); 


/* set absolute mode to "rw-r--r--" */ 
if (chmod("bar", S IRUSR | S IWUSR | S IRGRP | S IROTH) < O0) 


err sys("chmod error for bar"); 
exit (0); 


图 4-12 chmod FRAKES) 


在 运行 图 4-12 程 序 后 ， 这 两 个 文件 的 最 后 状态 是 : 
$ Is -l foo bar 


-rw-r--r-- 1 sar 0 Dec 7 21:20 bar-rw-rwSrw- 1 sar 0 Dec 7 21:20 foo 

在 本 例 中 ， 不 管 文 件 bar 的 当前 权限 位 如 何 ， 我 们 都 将 其 权限 设置 
为 一 个 绝对 值 。 对 文件 foo， 我 们 相对 于 其 当前 状态 设置 权限 。 为 此 ， 
先 调用 stat 获 得 其 当前 权限 ， 然 后 修改 它 。 我 们 显 式 地 打开 了 设置 组 ID 
位 、 关 闭 了 组 执行 位 。 注 意 ，1ls 命 令 将 组 执行 权限 表示 为 S， 它 表示 设 
置 组 ID 位 已 经 设置 ， 同 时 ， 组 执行 位 未 设置 。 

在 Solaris 中 ，1ls 命 令 显示 ] 而 非 S， 这 表明 对 该 文件 可 以 加 强制 性 文 
件 或 记录 锁 。 这 只 能 用 于 普通 文件 ，14.3 节 将 更 详细 地 讨论 这 一 点 。 

最 后 还 要 注意 ， 在 运行 图 4-12 程 序 后 ，1ls 命 令 列 出 的 时 间 和 日 期 并 
没有 改变 。 在 4.19 节 中 ， 我 们 会 了 解 到 chmod 函数 更 新 的 只 是 1 节点 最 
近 一 次 被 更 改 的 时 间 。 按 系统 默认 方式 ，ls -] 列 出 的 是 最 后 修改 文件 内 
容 的 时 间 。 

chmod 范 数 在 下 列 条 件 下 自动 清除 两 个 权限 位 。 

*Solaris 等 系统 对 用 于 普通 文件 的 粘着 位 赋予 了 特殊 含义 ， 在 这 些 
系统 上 如 果 我 们 试图 设置 普通 文件 的 粘着 位 (S_LISVTX) ， 而 且 又 没 
有 超级 用 户 权限 ， 那 么 mode 中 的 粘着 位 上 自动 被 关闭 (我 们 将 在 下 一 市 
说 明 粘 着 位 ) 。 这 意味 着 只 有 超级 用 户 才 能 设置 普通 文件 的 粘着 位 。 
这 样 做 的 理由 是 防止 恶意 用 户 设置 粘着 位 ， 由 此 影响 系统 性 能 。 

在 FreeBSD 8.0 和 Solaris 10 中 ， 只 有 超级 用 户 才能 对 普通 文件 设置 
粘着 位 。Linux 3.2.0 和 Mac OS X 10.6.8 对 设置 粘着 位 并 无 此 种 限制 ， 其 
原因 是 ， 粘 着 位 对 Linux 普 通 文 件 并 无 意义 。 虽 然 粘着 位 对 FreeBSD 的 
普通 文件 也 无 意义 ， 但 还 是 阻止 除 超级 用 户 以 外 的 任何 用 户 对 普通 文 
件 设置 该 位 。 

“新 创建 文件 的 组 ID 可 能 不 是 调用 进程 所 属 的 组 。 回 忆 一 下 4.6 
节 ， 新 文件 的 组 ID 可 能 是 父 目 录 的 组 ID。 特 别 地 ， 如 果 新 文件 的 组 ID 
不 等 于 进程 的 有 效 组 ID 或 者 进程 附属 组 ID 中 的 一 个 ， 而 且 进 程 没 有 超 


级 用 户 权 限 ， 那 么 设置 组 ID MAR HIRR AAE T RP gj 
一 个 设置 组 ID 文件 ， 而 该 文件 是 由 并 非 该 用 户 所 属 的 组 拥有 的 。 

这 种 情况 下 ，FreeBSD 8.0 对 试 图 设置 组 古 的 操作 肯定 会 返回 失 
败 ， 而 其 他 的 系统 则 无 声息 地 关闭 该 位 ， 但 不 会 对 试图 改变 文件 访问 
权限 的 操作 直接 做 失败 处 理 。 

FreeBSD 8.0、Linux 3.2.0 ` Mac OS X 10.6.8 和 Solaris 10387 T 55 
一 个 安全 性 功能 以 试图 阻止 误 用 某 些 保护 位 。 如 果 没 有 超级 用 户 权 限 
的 进程 写 一 个 文件 ， 则 设置 用 户 ID 位 和 设置 组 ID 位 会 被 自动 清除 。 如 
果 恶 意 用 户 找到 一 个 他 们 可 以 写 的 设置 组 ID 和 设置 用 户 ID 文件 ， 即 使 
可 以 修改 此 文件 ， 他 们 也 没有 对 该 文件 的 特殊 权限 。 


4.10 粘着 位 


S_ISVTX 位 有 一 段 有 趣 的 历史 。 在 UNIX 尚 未 使 用 请 求 分 页 式 技术 
的 早期 版 本 中 ，S_ISVTX 位 被 称 为 粘着 位 (sticky bit) 。 如 有 果 一 个 可 执 
行程 序 文件 的 这 一 位 被 设置 了 ， 那 么 当 该 程序 第 一 次 被 执行 ， 在 其 终 
止 时 ， 程 序 正文 部 分 的 一 个 副本 仍 被 保存 在 交换 区 (程序 的 正文 部 分 
是 机 器 指令 ) 。 这 使 得 下 次 执行 该 程序 时 能 较 快 地 将 其 装载 入 内 存 。 
其 原因 是 : 通常 的 UNIX 文 件 系 统 中 ， 文 件 的 各 数据 块 很 可 能 是 随机 存 
放 的 ， 相 比较 而 言 ， 交 换 区 是 个 作 为 一 个 连续 文件 来 处 理 的 。 对 于 通 
用 的 应 用 程序 ， 如 文本 编辑 程序 和 C 语 言 编 译 器 ， 我 们 和 常常 设置 它们 所 
在 文件 的 粘着 位 。 目 然 地 ， 对 于 在 交换 区 中 可 以 同时 存放 的 设置 了 烙 
着 位 的 文件 数 是 有 限制 的 ， 以 免 过 多 占用 交换 区 空间 ， 但 无 论 如 何 这 
是 一 个 有 用 的 技术 。 因 为 在 系统 再 次 目 举 前 ， 文 件 的 正文 部 分 总 是 在 
交换 区 中 ， 这 正 是 名 字 中 “粘着 ”的 由 来 。 后 来 的 UNIX 版 本 称 它 为 保存 
正文 位 (saved-text bit) ， 因 此 也 就 有 了 常量 S_ISVTX。 现 今 较 新 的 


UNIX 系 统 大 多 数 都 配置 了 虚拟 存储 系统 以 及 快速 文件 系统 ， 所 以 不 再 
需要 使 用 这 种 技术 。 

现今 的 系统 扩展 了 粘着 位 的 使 用 苑 围 ，Single UNIX Specification fù 
许 针对 目录 设置 粘着 位 。 如 果 对 一 个 目录 设置 了 粘着 位 ， 只 有 对 该 目 
录 具 有 写 权 限 的 用 户 并 且 满 足下 列 条 件 之 一 ， 才 能 删除 或 重 命名 该 目 
录 下 的 文件 : 

"拥有 此 文件 ; 

“拥有 此 目录 ; 

“是 超级 用 户 。 

目录 /tmp 和 /var/tmp 是 设置 粘着 位 的 典型 候选 者 一 任何 用 户 都 可 在 
这 两 个 目录 中 创建 文件 。 任 一 用 户 (用 户 、 组 和 其 他 ) 对 这 两 个 目录 
的 权限 通常 都 是 读 、 写 和 执行 。 但 是 用 户 不 应 能 删除 或 重 命名 属于 其 
他 人 的 文件 ， 为 此 在 这 两 个 目录 的 文件 模式 中 都 设置 了 粘着 位 。 

POSIX.1 没 有 定义 保存 正文 位 ，Single UNIX Specification 将 它 定义 
在 XSI 扩 展 部 分 » FreeBSD 8.0 ` Linux 3.2.0 ` Mac OS X 10.6.8 和 Solaris 
10 则 支持 这 种 功能 。 

在 Solaris 10 中 ， 如 果 对 普通 文件 设置 了 粘着 位 ， 那 么 它 就 具有 特 
殊 含义 。 在 这 种 情况 下 ， 如 果 任 何 执行 位 都 没有 设置 ， 那 么 操作 系统 
就 不 会 缓存 文件 内 容 。 


4.11 chown ^ fchown ^ fchownatZlllchown 


"Fi JLA chown HEC FH Plac l5 Ri PIDADZBID 。 如 果 两 个 参 
数 owner 或 group 中 的 任意 一 个 是 -1， 则 对 应 的 ID 不 变 


#include <unistd.h> 


int chown(const char *pathname, uid_t owner, gid_t group); 


int fchown(int fd, uid t owner, gid t group); 

int fchownat(int fd, const char *pathname, uid t owner, gid t group, int 
flag); 

int lchown(const char *pathname, uid_t owner, gid_t group); 

4 个 函数 的 返回 值 : ERD, illo; Auta, we- 

除了 所 引用 的 文件 是 符号 链接 以 外 ， 这 4 个 函数 的 操作 类 似 。 在 
符号 链接 情况 下 ， lchown 和 fchownat (设置 了 
AT_SYMLINK_NOFOLLOW 标 志 ) 更 改 符号 链接 本 身 的 所 有 者 ， 而 不 
是 该 符号 链接 所 指 同 的 文件 的 所 有 者 。 

fchown 了 芳 数 改变 fd 参数 指 辐 的 打开 文件 的 所 有 者 ， 既 然 它 在 一 个 已 
打开 的 文件 上 操作 ， 束 不 能 用 于 改变 符号 链接 的 所 有 痢 。 

fchownat 苹 数 与 chown 或 者 Ichown 了 芳 数 在 下 面 两 种 情况 下 是 相同 
Hy: 一 种 是 pathname 参 数 为 绝对 路 人 径 ， 男 一 种 是 fd 参数 取 值 为 
AT_FDCWD 而 pathname 参 数 为 相对 路 人 径 。 在 这 两 种 情况 下 ， 如 果 flag 参 
数 中 设置 了 AT_SYMLINK_NOFOLLOW 标 志 ，fchownat 与 lchown 行 为 
相同 ， 如 果 flag 参 数 中 清除 了 AT_SYMLINK_NOFOLLOW 标 志 ， 则 
fchownat 与 chown 行 为 相同 。 如 果 fd 参 数 设 置 为 打开 目录 的 文件 描述 
符 ， 并 且 pathname 参 数 是 一 个 相对 路 径 名 ，fchownat 函 数 计算 相对 于 打 
开 有 目录 的 pathname。 

基于 BSD 的 系统 一 直 规 定 只 有 超级 用 户 才 能 更 改 一 个 文件 的 所 有 
者 。 这 样 做 的 原因 是 防止 用 户 改变 其 文件 的 所 有 者 从 而 摆脱 磁盘 空间 
限额 对 他 们 的 限制 。System V 则 人 允许 任 一 用 户 更 改 他 们 所 拥有 的 文件 
的 所 有 者 。 

按照 POSIX_CHOWN_RESTRICTED 的 值 ，POSIX.1 人 允许 在 这 两 种 
形式 的 操作 中 选用 一 种 。 

对 于 Solaris 10， 此 功能 是 个 配置 选项 ， 其 默认 值 是 施加 限制 。 而 
FreeBSD 8.0、Linux 3.2.0 和 Mac OS X 10.6.8 则 总 对 chown 施 加 限制 。 


回忆 2.6 节 ，_POSIX_CHOWN_RESTRICTED 常 量 可 选 地 定义 在 头 
文件 <unistd.h> 中 ， 而 且 总 是 可 以 用 pathconf 或 fpathconf 芳 数 进 行 查询 。 
此 选项 还 与 所 引用 的 文件 有 关 一 可 在 每 个 文件 系统 基础 上 ， 使 该 选项 
起 作用 或 不 起 人 作用。 在 下 文中 ， 如 提 及 “者 
_POSIX_CHOWN_RESTRICTED 生 效 ”， 则 表示 “这 适用 于 我 们 正在 谈 
及 的 文件 ”， 而 不 管 该 实际 稼 量 是 否 在 头 文件 中 定义 。 

Zi POSIX_CHOWN_RESTRICTED 对 指定 的 文件 生效 ， 则 

(1) 只 有 超级 用 户 进 程 能 更 改 该 文件 的 用 户 ID 

(2) 如 果 进 程 拥 有 此 文件 “其 有 效用 户 ID 等 于 该 文件 的 用 户 
ID) ， 参 数 owner 等 于 -1 或 文件 的 用 户 ID ， 并 且 参 数 group 等 于 进程 的 有 
效 组 ID 或 进程 的 附属 组 ID 之 一 ， 那 么 一 个 非 超级 用 户 进程 可 以 更 改 该 
文件 的 组 ID 。 

这 意味 着 ， 当 _POSIX_CHOWN_RESTRICTED 有 效 时 ， 不 能 更 改 
其 他 用 户 文 件 的 用 户 ID。 你 可 以 更 改 你 所 拥 用 的 文件 的 组 ID ， 但 只 能 
改 到 你 所 属 的 组 。 

如 果 这 些 函 数 由 非 超级 用 户 进程 调用 ， 则 在 成 功 返 回 时 ， 该 文件 
的 设置 用 户 ID 位 和 设置 组 ID 位 都 被 清除 。 


4.12 文件 长 度 


stat 结 构成 员 st_size 表 示 以 字 贡 为 单位 的 文件 的 长 度 。 此 字段 只 对 
普通 文件 、 目 录 文 件 和 符号 链接 有 意义 。 

FreeBSD 8.0、Mac OS X 10.6.8 和 Solaris 10 对 管道 也 定义 了 文件 长 
E, ERR MA RI PLEIN TA, BOT EIS. 24 ie Bie © 

对 于 普通 文件 ， 其 文件 长 度 可 以 是 0， 在 开始 读 这 种 文件 时 ， 将 得 
到 文件 结束 (end-of-file) 指示 。 对 于 目录 ， 文 件 长 度 通 常 是 一 个 数 


(如 16 或 512) 的 整 倍数 ， 我 们 将 在 4.22 市 中 说 明 读 目录 操作 。 

对 于 符号 链接 ， 文 件 长 度 是 在 文件 名 中 的 实际 字 厄 数 。 例 如 ， 在 
下 面 的 例子 中 ， 文 件 长 度 7 就 是 路 径 名 usr/lib 的 长 度 : 

Irwxrwxrwx 1 root 7 Sep 25 07:14 lib -> usr/lib 

(注意 ， 因 为 符号 链接 文件 长 度 总 是 由 st_size 指 示 ， 所 以 它 并 不 包 

含 通常 C 语 言 用 作 名 字 结 尾 的 null 字 节 “。 ) 

现今 ， 大 多 数 现 代 的 UNIX 系 统 提 供 字 段 stL_blksize 和 st_blocks。 其 
中 ， 第 一 个 是 对 文件 VO 较 合适 的 块 长 度 ， 第 二 个 是 所 分 配 的 实际 512 字 
节 块 块 数 。 回 忆 3.9 太 ， 其 中 提 到 了 当 我 们 将 st_blksize 用 于 读 操 作 时 ， 
读 一 个 文件 所 需 的 时 间 量 最 少 。 为 了 提高 效率 ， 标 准 VO 库 (我 们 将 在 
第 5 章 中 说 明 ) 也 试图 一 次 恋 、 写 st_blksize 个 字 记 。 

应 当 了 解 的 是 ， 不 同 的 UNIX 版 本 其 st_blocks 所 用 的 单位 可 能 不 是 
512 字 节 的 块 。 使 用 此 值 并 不 是 可 移植 的 。 

文件 中 的 空洞 

在 3.6 节 中 ， 我 们 提 及 普通 文件 可 以 包含 空洞 。 在 图 3-2 程序 中 例 
示 了 这 一 点 。 裕 洞 是 由 所 设置 的 侦 移 量 超过 文件 尾 端 ， 并 写 人 了 某 些 
数据 后 造成 的 。 作 为 一 个 例子 ， 考 虚 下 列 情况 : 

$ Is -] core 

-rW-r--r-- 1 sar 8483248 Nov 18 12:18 core 

$ du -s core 

272 core 

文件 core 的 长 度 稍 稍 超过 8 MB， 可 是 du 命令 报告 该 文件 所 使 用 的 
磁盘 空间 总 量 是 272 个 512 字 节 块 ( 即 139 264 字 节 ) 。 很 明显 ， 此 文件 
中 有 很 多 空洞 。 

在 很 多 BSD 类 系统 上 ，du 命 令 报告 的 是 1 024 字 下 块 的 块 数 ， 
Solaris 报 告 的 是 512 字 节 块 的 块 数 。 在 Linux 上 ， 报 告 的 块 数 单位 取决 于 
是 否 设置 了 环境 变量 POSIXLY_CORRECT。 当 设置 了 该 环境 变量 ，du 


命令 报告 的 是 1024 X BIRBJZONG KRARRAZYRS EN, du 命令 
报告 的 是 512 字 节 块 的 块 数 。 

正如 我 们 在 3.6 广 中 提 及 的 ， 对 于 没有 写 过 的 字 市 位 置 ，read 函 数 
读 到 的 字 市 是 0。 如 末 执 行 下 面 的 命令 ， 可 以 看 出 正常 的 /O 操 作 读 整个 
文件 长 度 : 

$ wc -c core 

8483248 core 

带 -c 选 项 的 wc(1) 命 令 计算 文件 中 的 字符 数 ( 字 节 ) 

如 果 使 用 实用 程序 (如 cat(1)) 复制 这 个 文件 ， 那 么 所 有 这 些 空洞 
都 会 被 填 满 ， 其 中 所 有 实际 数据 字 广 家 填写 为 0。 


$ cat core > core.copy 


$ Is -] core* 

-rw-r--r-- 1 sar 8483248 Nov 18 12:18 core 

-rw-rw-r-- 1 sar 8483248 Nov 18 12:27 core.copy 

$ du -s core* 

272 core 

16592 core.copy 

从 中 可 见 ， 新 文件 所 用 的 实际 字 节 数 是 8 495 104. (512x16 592) 

此 长 度 与 ls 命令 报告 的 长 度 不 同 ， 其 原因 是 ， 文 件 系 统 使 用 了 若干 块 以 
存放 指 同 实际 数据 块 的 各 个 指针 。 

有 兴趣 的 读者 可 以 参阅 Bach[1986] 的 4.2 节 、McKusick 等 [1996] 的 
7.215 4807.38. (2% McKusick f} Neville-Neil[2005] MJ 8.2 3 708.37) ^ 
McDougall 和 Mauro[2007] 的 15.2 市 以 及 Singh[2006] 的 第 12 章 ， 以 更 详细 
地 了 解 文件 的 物理 结构 。 


4.13 文件 截断 


有 时 我 们 需要 在 文件 尾 端 处 截 去 一 些 数据 以 缩短 文件 。 将 一 个 文 
件 的 长 度 截断 为 0 是 一 个 特例 ， 在 打开 文件 时 使 用 O_TRUNC 标志 可 以 
做 到 这 一 点 。 为 了 截断 文件 可 以 调用 函数 truncate 和 ftruncate ° 

#include <unistd.h> 

int truncate(const char *pathname, off t length); 

int ftruncate(int fd, off t length); 

两 个 函数 的 返回 值 : 者 成 功 ， 返 回 0; 在 出 错 ， 返 回 -1 

这 两 个 函数 将 一 个 现 有 文件 长 度 截断 为 length。 如 果 该 文件 以 前 的 
长 度 大 于 length， 则 超过 length 以 外 的 数据 就 不 再 能 访问 。 如 果 以 前 的 
长 度 小 于 length， 文 件 长 度 将 增加 ， 在 以 前 的 文件 尾 端 和 新 的 文件 尾 端 
之 间 的 数据 将 读 作 0 (也 就 是 可 能 在 文件 中 创建 了 一 个 空洞 。 

早 于 4.4BSD 的 BSD 系 统 只 能 用 truncate 函 数 截 短 一 个 文件 ， 不 能 
Tg eT tee 

Solaris 对 fcnd 函 数 进 行 了 扩展 ， 增 加 了 F_FREESP， 它 允许 释放 一 
个 文件 中 的 任何 一 部 分 ， 而 不 只 是 文件 尾 端 处 的 一 部 分 。 

图 13-6 的 程序 使 用 了 ftruncate 函 数 ， 以 便 在 获得 对 一 个 文件 的 锁 
后 ， 清 空 该 文件 。 


4.14 PRIL 


为 了 说 明文 件 链接 的 概念 ， 先 要 介绍 UNIX 文 件 系 统 的 基本 结构 。 
同时 ， 了 解 i 节点 和 指向 i 节点 的 目录 项 之 间 的 区 别 也 是 很 有 益 的 。 

目前 ， 正 在 使 用 的 UNIX 文 件 系统 有 多 种 实现 。 例 如 ，Solaris 文 持 
多 种 不 同类 型 的 磁盘 文件 系统 : 传统 的 基于 BSD 的 UNIX 文 件 系统 〈 称 
为 UFS) ， 读 、 写 DOS 格 式 软盘 的 文件 系统 ( 称 为 PCFS) ， 以 及 读 CD 
的 文件 系统 ( 称 为 HSFS) 。 在 图 2-20 中 ， 我 们 已 经 看 到 了 不 同类 型 文 


件 系统 的 一 个 区 别 。UFS 是 以 Berkeley 快 速 文件 系统 为 基础 的 。 本 节 讨 
论 该 文件 系统 。 

每 一 种 文件 系统 类 型 都 有 它 各 自 的 特征 ， 有 些 特征 可 能 是 混淆 不 
清 的 。 例 如 ， 大 部 分 UNIX 文 件 系 统 文 持 大 小 写 敏 感 的 文件 名 。 因 此 ， 
如 果 创 建 了 一 个 名 为 file.txt 的 文件 以 及 另外 一 个 名 为 fle.TXT 的 文件 ， 
就 是 创建 了 两 个 不 同 的 文件 。 在 Mac OS X 上 ，HFS 文 件 系 统 是 大 小 写 
保留 的 ， 并 且 是 大 小 写 不 敏感 比较 的 。 因 此 ， 如 果 创 建 了 一 个 名 为 
file.txt 的 文件 ， 当 你 再 创建 名 为 fle.TXIT 的 文件 时 ， 就 会 覆盖 原来 的 
file.txt 文 件 。 但 是 ， 保 存在 文件 系统 中 的 是 文件 创建 时 的 文件 名 CRI 
file.txt， 因 为 是 大 小 写 保 留 的 ) ° SL, Æ i, l e, ., t, x, 已 这 个 序列 
中 的 大 写 或 小 写字 母 的 排列 都 会 在 搜索 这 个 文件 时 得 到 匹配 (大 小 写 
不 敏感 比较 ) 。 因 此 ， 除 了 和 旬 etxt 和 fie.TXT， 我 们 还 可 以 用 File.txt、 
fILE.tXt 以 及 FiLe.TxT 等 名 字 来 访问 该 文件 。 

我 们 可 以 把 一 个 磁盘 分 成 一 个 或 多 个 分 区 。 每 个 分 区 可 以 包含 一 
个 文件 系统 ( 见 图 4-13) 。i 节 点 是 固定 长 度 的 记录 项 ， 它 包含 有 关 文 
件 的 大 部 分 信息 。 


磁盘 分 区 | 分 区 | 分 区 
文件 系统 | 柱 面 组 0 柱 面 组 1 C 柱 面 组 n 
| 
"PN 
超级 块 a 
超级 块 | 配置 | i 节点 | yp， TT 71 
副本 | 信息 | 图 | 块 位 图 | INA | am 


i 节点 


图 4-13 人 磁盘 、 分 区 和 文件 系统 


如 果 更 仔细 地 观察 一 个 柱 面 组 的 i 节点 和 数据 块 部 分 ， 则 可 以 看 到 
图 4-14 中 所 示 的 情况 。 注 意图 4-14 中 的 下 列 各 点 。 

“在 图 中 有 两 个 目录 项 指向 同一 个 i 节 点 。 每 个 i 节 点 中 都 有 一 个 链 
接 计 数 ， 其 值 是 指 疝 该 i 节点 的 目录 项 数 。 只 有 当 链 接 计数 减少 至 0 时 ， 
才 可 删除 该 文件 (也 就 是 可 以 释放 该 文件 占用 的 数据 块 ) 。 这 就 是 为 
什么 “解除 对 一 个 文件 的 链接 ”操作 并 不 总 是 意味 着 “释放 该 文件 占用 的 
磁盘 块 2> 的 原因 。 这 也 是 为 什么 删除 一 个 目 孙 项 的 函数 被 称 之 为 unlink 
而 不 是 delete 的 原因 。 在 stat 结 构 中 ， 链 接 计 数 包含 在 st_nlink 成 员 中 ， 
其 基本 系统 数据 类 型 是 nlink_t。 这 种 链接 类 型 称 为 硬 链 接 。 回 忆 2.5.2 
节 ， 其 中 ，POSIX.1 常 量 LINK_MAX 指 定 了 一 个 文件 链接 数 的 最 大 值 。 
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图 4-14 较 详 细 的 柱 面 组 的 i 节 点 和 数据 块 

“另外 一 种 链接 类 型 称 为 符号 链接 (symbolic link) 。 符 号 链接 文件 
的 实际 内 容 (在 数据 块 中 ) 包含 了 该 符号 链接 所 指向 的 文件 的 名 字 。 
在 下 面 的 例子 中 ， 目 永 项 中 的 文件 名 是 3 个 字符 的 字符 串 lib， 而 在 该 文 
件 中 包 售 了 7 个 字 克 的 数据 usvlib: 

Irwxrwxrwx 1 root 7 Sep 25 07:14 lib -> urs/lib 

该 i 节 点 中 的 文件 类 型 是 S_ IFLNK， 于 是 系统 知道 这 是 一 个 符号 链 
f£ © 


“iT 点 包含 了 文件 有 天 的 所 有 信息 : 文件 类 型 、 文 件 访问 权限 位 、 
文件 长 度 和 指向 文件 数据 块 的 指针 等 。stat 结 构 中 的 大 多 数 信 息 都 取 自 i 
广 点 。 只 有 两 项 重要 数据 存放 在 目录 项 中 文件 名 和 iT 点 编号 。 其 他 
的 数据 项 (如 文件 名 长 度 和 目录 记录 长 度 ) 并 不 是 本 书 关 心 的 。i 节 点 
编号 的 数据 类 型 是 ino_t。 

"因为 目录 项 中 的 i 节点 编 号 指向 同一 文件 系统 中 的 相应 i 厄 点 ， 一 
个 目录 项 不 能 指 同 男 一 个 文件 系统 的 i 太 点 。 这 束 是 为 什么 In(1) 命 令 

(构造 一 个 指向 一 个 现 有 文件 的 新 目录 项 ) 不 能 跨越 文件 系统 的 原 
e 我 们 将 在 下 一 地 说 明 link 函 数 。 

“ 当 在 不 更 换文 件 系 统 的 情况 下 为 一 个 文件 重 命 名 时 ， 该 文件 的 实 
际 内 容 并 未 移动 ， 只 需 构 造 一 个 指 辣 现 有 i 节点 的 新 目录 项 ， 并 删除 老 
的 目录 项 。 链 接 计 数 不 会 改变 。 例 如 ， 为 将 文件 /usrlib/foo 重 命名 
为 /usr/foo， 如 有 果 目 录 /usr/ib 和 /usr 在 同一 文件 系统 中 ， 则 文件 foo 的 内 容 
无 需 移动 。 这 束 是 mv(1) 命 令 的 通常 操作 方式 。 

我 们 说 明了 普通 文件 的 链接 计数 概念 ， 但 是 对 于 目录 文件 的 链接 
计数 字段 又 如 何 呢 ? 假定 我 们 在 工作 目录 中 构造 了 一 个 新 目录 : 

$ mkdir testdir 

图 4-15 显 示 了 其 结果 。 注 意 ， 该 图 显 式 地 显示 了 .和 .. 目 录 项 。 

编写 为 2549 的 i 广 点 ， 其 类 型 字段 表示 它 是 一 个 目录 ， 链 接 计 数 为 
2。 任 何 一 个 叶 目 录 (不 包含 任何 其 他 目录 的 目录 ) 的 链接 计数 总 是 
2， 数 值 2 来自 于 命名 该 日 录 (testdir) 的 目录 项 以 及 在 该 目录 中 的 .项 。 
编号 为 1267 的 i 订 点， 其 类 型 字段 表示 它 是 一 个 目 孙 ， 链 接 计 数 大 于 或 
等 于 3。 它 大 于 或 等 于 3 的 原因 是 ， 至 少 有 3 个 目 孙 项 指 回 它 : 一 个 是 命 
名 它 的 目录 项 〈 在 图 4-15 中 没有 表示 出 来 ) ， 第 二 个 是 在 该 目录 中 的 . 
项 ， 第 三 个 是 在 其 子 目录 testdir 中 的 .. 项 。 注 意 ， 在 父 目录 中 的 每 一 个 
子 目 录 都 使 该 父 目录 的 链接 计数 增加 1 。 
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图 4-15 创建 了 目录 testdir 后 的 文件 系统 实例 

这 种 格式 与 UNIX 文 件 系统 的 经 典 格式 类 似 ， 在 Bach[1986] 的 第 4 章 
中 对 此 进行 了 详细 说 明 。 天 于 伯克利 快速 文件 系统 对 此 所 做 的 更 改 请 
参阅 McKusick 等 [1996] 的 第 7 章 以 及 McKusick 和 Neville-Neil[2005] 中 
的 第 8 章 。 关 于 UEFS (伯克利 快速 文件 系统 的 Solaris 版 ， 的 详细 情况 ， 
请 参见 McDougall 和 Mauro[2007] 的 第 15 章 。 关 于 Mac OS X 使 用 的 HFS 
文件 系统 格式 ， 请 参阅 Singh[2006] 的 第 12 章 。 


4.15 ink ` linkat ` unlink ` unlnkat*iremove 


如 上 市 所 述 ， 任 何 一 个 文件 可 以 有 多 个 目录 项 指向 其 i 条 点。 创建 
一 个 指 同 现 有 文件 的 链接 的 方法 是 使 用 link 函 数 或 linkat 函 数 。 


#include <unistd.h> 


int link(const char *existingpath, const char *newpath); 

int linkat(int efd, const char *existingpath, int nfd, const char *newpath, 
int flag); 

两 个 函数 的 返回 值 : ARH, GRIGIO; 在 出 错 ， 返 回 -1 

这 两 个 函数 创建 一 个 新 目录 项 newpath， 它 引用 现 有 文件 
existingpath。 如 果 newpath 已 经 存在 ， 则 返回 出 错 。 只 创建 newpath 中 的 
最 后 一 个 分 量 ， 路 径 中 的 其 他 部 分 应 当 已 经 存在 。 

对 于 linkat 函 数 ， 现 有 文件 是 通过 efd 和 existingpath 参 数 指定 的 ， 新 
的 路 径 名 是 通过 nfd 和 newpath 参 数 指定 的 。 默 认 情 况 下 ， 如 果 两 个 路 径 
名 中 的 任 一 个 是 相对 路 径 ， 那 么 它 需要 通过 相对 于 对 应 的 文件 描述 符 
进行 计算 。 如 果 两 个 文件 描述 符 中 的 任 一 个 设置 为 AT_FDCWD， 那 么 
相应 的 路 径 名 (如 果 它 是 相对 路 径 ) 就 通过 相对 于 当前 目录 进行 计 
算 。 如 果 任 一 路 径 名 是 绝对 路 径 ， 相 应 的 文件 描述 符 参 数 吏 会 被 忽 
WE o 


当 现 有 文件 是 符号 链接 时 ， 由 flag 参 数 来 控制 linkat 函 数 是 创建 指向 
现 有 符号 链接 的 链接 还 是 创建 指向 现 有 符号 链接 所 指向 的 文件 的 链 
接 。 如 果 在 flag 参 数 中 设置 了 AT_SYMLINK_FOLLOW 标 志 ， 就 创建 指 
问 符号 链接 目标 的 链接 。 如 果 这 个 标志 被 清除 了 ， 则 创建 一 个 指 癌 符 
号 链接 本 身 的 链接 。 

创建 新 目录 项 和 增加 链接 计数 应 当 是 一 个 原子 操作 (请 回忆 在 3.11 
节 中 对 原子 操作 的 讨论 ) 。 

虽然 POSIX.1 人 允许 实现 支持 跨越 文件 系统 的 链接 ， 但 是 大 多 数 实现 
要 求 现 有 的 和 新 建 的 两 个 路 径 名 在 同一 个 文件 系统 中 。 如 果实 现 文 持 
创建 指向 一 个 目录 的 硬 链 接 ， 那 么 也 仅 限 于 超级 用 户 才 可 以 这 样 做 。 
其 理由 是 这 样 做 可 能 在 文件 系统 中 形成 循环 ， 大 多 数 处 理 文件 系统 的 
实用 程序 都 不 能 处 理 这 种 情况 (4.17 节 将 说 明 一 个 由 符号 链接 引入 循 
环 的 例子 ) 。 因 此 ， 很 多 文件 系统 实现 不 允许 对 于 目录 的 硬 链 接 。 


NT GR SWAY Bae, FT DA el unlink ex o 
#include <unistd.h> 
int unlink(const char *pathname); 
int unlinkat(int fd, const char *pathname, int flag); 
两 个 函数 的 返回 值 : AH, GRIGIO; 奉 出 错 ， 返 回 -1 
这 两 个 男 数 删除 目录 项 ， 并 将 由 pathname 所 引用 文件 的 链接 计数 
V1 o 如果 对 该 文件 还 有 其 他 链接 ， 则 仍 可 通过 其 他 链接 访问 该 文件 的 
数据 。 如 采 出 错 ， 则 不 对 该 文件 做 任何 更 改 。 
我 们 在 前 面 已 经 提 及 ， 为 了 解除 对 文件 的 链接 ， 必 须 对 包含 该 目 
录 项 的 目录 具有 写 和 执行 权限 。 正 如 4.10 市 所 述 ， 如 果 对 该 目录 设置 了 
粘着 位 ， 则 对 该 目录 必须 具有 写 权 限 ， 并 且 具 备 下 面 三 个 条 件 之 一 : 
。 拥 有 该 文件 ; 
“拥有 该 目录 ; 
具有 超级 用 户 权限 。 
只 有 当 链 接 计 数 达 到 0 时 ， 该 文件 的 内 容 才 可 被 删除 。 另 一 个 条 件 
会 阻止 删除 文件 的 内 容 一 只 要 有 进程 打开 了 该 文件 ， 其 内 容 也 不 能 
删除 。 关 闭 一 个 文件 时 ， 内 核 首 先 检查 打开 该 文件 的 进程 个 数 ， 如 果 
这 个 计数 达到 0， 内 核 再 去 检查 其 链接 计数 ; 如 果 计 数 也 是 0， 那 么 就 
删除 该 文件 的 内 容 。 
如 果 pathname 参 数 是 相对 路 人 径 名 ， 那 么 unlinkat 范 数 计 算 相 对 于 由 
fd 文件 描述 符 参 数 代 表 的 目录 的 路 径 名 。 如 果 fd 参 数 设 置 为 
AT FDCWD, ， 那 么 通过 相对 于 调用 进程 的 当前 工作 目录 来 计算 路 径 
名 。 如 果 pathname 参 数 是 绝对 路 径 名 ， 那 么 fd 参数 被 忽略 。 
flag 参 数 给 出 了 一 种 方法 ， 使 调用 进程 可 以 改变 unlinkat 函 数 的 默认 
行为 。 当 AT REMOVEDIR 标 志 被 设置 时 ，unlinkat 函数 可 以 类 似 于 
rmdir 一 样 删除 目录 。 如 果 这 个 标志 被 清除 ，unlinkat 与 unlink 执 行 同样 
的 操作 。 


实例 
图 4-16 的 程序 打开 一 个 文件 ， 然 后 解除 它 的 链接 。 执 行 该 程序 的 进 
程 然 后 睡眠 15 秒 ， 接 着 就 终止 。 


#include "apue.h" 
#include «fcntl.h» 


int 
main (void) 
{ 
if (open("tempfile", O_RDWR) < 0) 
err sys("open error"); 
if (unlink("tempfile") « 0) 
err sys("unlink error"); 
printf("file unlinked\n") ; 


sleep (15); 
printf ("done\n") ; 
exit (0); 


图 4-16 打开 一 个 文件 ， 然 后 unlink 它 


运行 该 程序 ， 其 结果 是 : 


$ Is -l tempfile 查看 文件 大 小 
-IW-r----- 1 sar 413265408 Jan 21 07:14 tempfile 
$ df /home Tert n] FA 5 2 2 [RI 


Filesystem 1K-blocks Used Available Use% Mounted on/dev/hda4 
11021440 1956332 9065108 1896 /home 


$ /a.out & 在 后 人 台 运 行 图 4-16 程 序 
1364 shell 打 印 其 进程 ID 
$ file unlinked 解除 文件 链接 

ls -] tempfile 观察 文件 是 否 仍然 存在 


Is: tempfile: No such file or directory 目录 项 已 删除 
$ df /home 检查 可 用 磁盘 空间 有 无 变化 


Filesystem 1K-blocks Used Available Use% Mounted on/dev/hda4 
11021440 1956332 9065108 1896 /home 


$ done 程序 执行 结束 ， 关 闭 所 有 打开 
文件 
df /home 现在 ， 应 当 有 更 多 可 用 磁盘 空 


间 

Filesystem 1K-blocks Used Available Use% Mounted on 

/dev/hda4 11021440 1552352 9469088 15% /home 

现在 ，394.1 MB 人 磁盘 空间 可 用 

unlink 的 这 种 特性 经 常 被 程序 用 来 确保 即使 是 在 程序 崩溃 时 ， 它 所 
创建 的 临时 文件 也 不 会 遗留 下 来 。 进 程 用 open 或 creat 创 建 一 个 文件 ， 
然后 立即 调用 unlink， 因 为 该 文件 仍旧 是 打开 的 ， 所 以 不 会 将 其 内 容 删 
除 。 只 有 当 进程 关闭 该 文件 或 终止 时 (在 这 种 情况 下 ， 内 核 关 闭 该 进 
程 所 打开 的 全 部 文件 ) ， 该 文件 的 内 容 才 被 删除 。 

如 果 pathname 是 符号 链接 ， 那 么 unlink 删 除 该 符号 链接 ， 而 不 是 删 
除 由 该 链接 所 引用 的 文件 。 给 出 符号 链接 名 的 情况 下 ， 没 有 一 个 函数 
能 删除 由 该 链接 所 引用 的 文件 。 

如 果 文 件 系统 支持 的 话 ， 超 级 用 户 可 以 调用 unlink， 其 参数 
pathname 指 定 一 个 目 示 ， 但 是 通 间 应 当 使 用 rmdir 函 数 ， 而 不 使 用 unlink 
这 种 方式 。 我 们 将 在 4.21 节 中 说 明 rmdir 函 数 。 

我 们 也 可 以 用 remove 函数 解除 对 一 个 文件 或 目录 的 链接 。 对 于 文 
件 ，remove 的 功能 与 unlink 相 同 。 对 于 目录 ，remove 的 功能 与 rmdir 相 
同 。 


#include <stdio.h> 


int remove(const char *pathname); 


返回 值 : ERD, WO; 者 出错 ， 返 回 -1 


ISO CH Æ remove LH AUT ER— ALIF, xx EXC T UNIX EJ OR fs FH BJ 
名 字 unlink， 其 原因 是 实现 C 标 准 的 大 多 数 非 UNIX 系 统 并 不 文 持 文件 链 
接 。 


4.10 rename7Hrenameat 


IFEX H si n] DA rename cx ZG renameat ER ZICIETT EMA ° 
#include <stdio.h> 
int rename(const char *oldname, const char *newname); 
int renameat(int oldfd, const char *oldname, int newfd, const char 
*newname); 
两 个 图 数 的 返回 值 : ERD, xx[Eo; cdi. we- 
ISO C 对 文件 定义 了 rename 函 数 (C 标 准 不 处 理 目录 ) 。POSIX.1 扩 
展 此 定义 ， 使 其 包含 了 目录 和 符号 链接 。 
根据 oldname 是 指 文件 、 目 录 还 是 符号 链接 ， 有 几 种 情况 需要 加 以 
说 明 。 我 们 也 必须 说 明 如 果 newname 已 经 存在 时 将 会 发 生 什么 。 
(1) 如 果 oldname 指 的 是 一 个 文件 而 不 是 目录 ， 那 么 为 该 文件 或 
从 号 链接 重 命名 。 在 这 种 情况 下 ， 如 果 newname 已 存在 ， 则 它 不 能 引用 
一 个 目录 。 如 采 newname 已 存在 ， 而 且 不 是 一 个 目录 ， 则 先 将 该 目录 项 
删除 然后 将 oldname 重 命名 为 newname。 对 包含 oldname 的 目录 以 及 
包含 newname 的 目录 ， 调 用 进程 必须 具有 写 权 限 ， 因 为 将 更 改 这 两 个 目 
录 。 
(2) 如 若 oldname 指 的 是 一 个 目录 ， 那 么 为 该 目录 重 命名 。 如 果 
newname 已 存在 ， 则 它 必须 引用 一 个 目录 ， 而 且 该 目录 应 当 是 空 目 杂 
( 空 目录 指 的 是 该 目录 中 只 有 .和 .. 项 ) 。 如 果 newname 存 在 (而且 是 一 
PEAS) ， 则 先 将 其 删除 ， 然 后 将 oldname 重 命名 为 hewname。 田 


外 ， 当 为 一 个 目录 重 命名 时 ，newname 不 能 包含 oldname 作 为 其 路 径 前 
绥 。 例 如 ， 不 能 将 msvfoo 重 命名 为 /asrfoo/estdir ， 因 为 旧名 字 
(/usr/foo) 是 新 名 字 的 路 径 前 级 ， 因 而 不 能 将 其 删除 。 

(3) 如 若 oldname 或 newname 引 用 符号 链接 ， 则 处 理 的 是 符号 链接 
本 号， 而 不 是 它 所 引用 的 文件 。 

(4) 不 能 对 .和 .. 重 命名 。 更 确切 地 说 ，. 和 .. 都 不 能 出 现在 oldname 
和 newname 的 最 后 部 分 。 

(5) 作为 一 个 特例 ， 如 果 oldname 和 newname 引 用 同一 文件 ， 则 画 
数 不 做 任何 更 改 而 成 功 返 回 。 

如 若 newname 已 经 存在 ， 则 调用 进程 对 它 需 要 有 写 权 限 (如 同 删 除 
情况 一 样 ) 。 另 外 ， 调 用 进程 将 删除 oldname 目 孙 项 ， 并 可 能 要 创建 
newname 目 录 项 ， 所 以 它 需 要 对 包含 oldname 及 包 售 newname 的 目录 具 
有 写 和 执行 权限 。 

除了 当 oldname 或 newname 指 回 相 对 路 径 名 时 ， 其 他 情况 下 
renameat EZ = rename EX 237] RE TH [Fl o "lla oldname ZR E. T FANT PS 
f$. WAX T oldta 2 Z1 5| FH B B eK TTE SE oldname ° RMH, WAR 
newname jH E | THO RTE, BEAR T newfd 5| Fl BJ H Se KI E 
newname ° oldfdzXnewfd 2X (或 两 者 ) 都 能 设置 成 AT_FDCWD， 此 时 
相对 于 当前 目录 来 计算 相应 的 路 人 径 名 。 


4.17 链 


符号 链接 是 对 一 个 文件 的 间接 指针 ， 它 与 上 一 世 所 述 的 硬 链接 有 
所 不 同 ， 硬 链接 直接 指 同 文件 的 1 六 点。 引入 符号 链接 的 原因 是 为 了 避 
开 便 链 接 的 一 些 限 制 。 

“ 便 链 接 通常 要 求 链接 和 文件 位 于 同一 文件 系统 


"只 有 超级 用 户 才能 创建 指向 目录 的 硬 链 接 (在 底层 文件 系统 支持 
的 情况 下 ) 。 

对 符号 链接 以 及 它 指 向 何 种 对 象 并 无 任何 文件 系统 限制 ， 任 何 用 
户 都 可 以 创建 指向 目录 的 符号 链接 。 符 号 链接 一 般 用 于 将 一 个 文件 或 
整个 目录 结构 移 到 系统 中 男 一 个 位 置 。 

当 使 用 以 名 字 引 用 文件 的 函数 时 ， 应 当 了 解 该 函数 是 否 处 理 符 号 
链接 。 也 就 是 该 函数 是 否 跟 随 符号 链接 到 达 它 所 链接 的 文件 。 如 若 该 
函数 具有 处 理 符 号 链接 的 功能 ， 则 其 路 径 名 参数 引用 由 符号 链接 指向 
的 文件 。 和 否则 ， 一 个 路 径 名 参数 引用 链接 本 喘 ， 而 不 是 由 该 链接 指向 
的 文件 。 图 4-17 列 出 了 本 章 中 所 说 明 的 各 个 函数 是 否 处 理 符号 链接 。 在 
图 4-17 中 没有 列 出 mkdir ^ mkinfo ` mknodZlrmdirix Ze ER Zi, HJR [X] 
是 ， 当 路 径 名 是 符号 链接 时 ， 它 们 都 出 错 返 回 。 以 文件 描述 符 作 为 参 
数 的 一 些 函 数 (如 fstat、fchmod 等 ) 也 未 在 该 图 中 列 出 ， 其 原因 是 ， 对 
符号 链接 的 处 理 是 由 返回 文件 描述 符 的 函数 〈 通 常 是 open) 进行 的 。 
chown 是 否 跟 随 符号 链接 取决 于 实现 。 在 所 有 现代 的 系统 中 ，chown 函 
数 都 跟随 符号 链接 。 

符号 链接 由 4.2BSD 引 入 ，chown 最 初 并 不 跟随 符号 链接 ， 但 在 
4.4BSD 中 情况 发 生 了 变化 。SVR4 中 的 System V 包 含 了 对 符号 链接 的 文 
持 ， 但 与 原始 BSD 中 的 行为 已 大 不 相同 ， 也 实现 了 chown 函 数 跟随 符号 
链接 。 早 期 Linux 版 本 中 (Linux 2.1.81 以 前 的 版 本 ) ，chown 并 不 跟随 
符号 链接 。 从 2.1.81 版 开始 ，chown 跟 随 符号 链接 。FreeBSD 8.0、Mac 
OS X 10.6.8 和 Solaris 10 中 ， chown 跟 随 符号 链接 。 所 有 这 些 平台 都 实 
现 了 lchown， 它 改变 符号 链接 目 且 的 所 有 权 。 
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access 
chdir 
chmod 
chown 
creat 
exec 
lchown 
link 
lstat 
open 
opendir 
pathconf 
readlink 
remove 
rename 
stat 
truncate 
unlink 


图 4-17 各 个 函数 对 符号 链接 的 处 理 


图 4-17 的 一 个 例外 是 ， 同 时 用 O_CREAT 和 O_EXCL 两 者 调用 open 
函数 。 在 此 情况 下 ， 若 路 径 名 引用 符号 链接 ，open 将 出 错 返 回 ，erro 


设置 为 EEXIST。 这 种 处 理 方式 的 意图 是 堵塞 一 个 安全 性 漏洞 ， 以 防止 
具有 特权 的 进程 被 诱骗 写 错误 的 文件 。 
实例 


使 用 符号 链接 可 能 在 文件 系统 中 引入 循环 。 大 多 数 查 找 路 径 名 的 
函数 在 这 种 情况 发 生 时 都 将 出 错 返 回 ，errno 值 为 ELOOP。 考 虑 下 列 命 


SJF]: 
$ mkdir foo 创建 一 个 新 目录 
$ touch foo/a 创建 一 个 0 长 度 的 文件 
$ In -s ../foo foo/testdir 创建 一 个 符号 链接 
-rW-T----- 1 sar 0 Jan 22 00:16 a 
Irwxrwxrwx 1 sar 6 Jan 22 00:16 testdir -> ../foo 
$ Is -l1 foo 
total 0 


这 创建 了 一 个 目录 foo， 它 包含 了 一 个 名 为 8 的 文件 以 及 一 个 指向 
foo 的 符号 链接 。 在 图 4-18 中 显示 了 这 种 结果 ， 图 中 以 圆 表示 目录 ， 以 
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foo «- 
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'testdir| 
Na 
图 4-18 构成 循环 的 符号 链接 testdir 
如 果 我 们 写 一 段 简 单 的 程序 ， 使 用 Solaris 的 标准 函数 ftw(3) 以 降序 
裔 历 文件 结构 ， 打 印 每 个 过 到 的 路 人 径 名 ， 则 其 输出 古 : 


foo 


foo/a 


foo/testdir 

foo/testdir/a 

foo/testdir/testdir 

foo/testdir/testdir/a 

foo/testdir/testdir/testdir 

foo/testdir/testdir/testdir/a 

(更 多 行 ， 直 至 ftw 出 错 返 回 ， 此 时 ，errno 值 为 ELOOP) 

4.22 市 提供 了 我 们 目 己 的 ftw 芳 数 版 本 ， 它 用 ]stat 代 类 stat 以 阻止 它 
跟随 符号 链接 。 

注意 ，Linux 的 ftw 和 nftw 芳 数 记 录 了 所 有 看 到 的 目录 并 避免 多 次 重 
复 处 理 一 个 目 孙 ， 因 此 这 两 个 函数 不 显示 这 种 程序 运行 行为 。 

这 样 一 个 循环 是 很 容易 消除 的 。 因 为 unlink 并 不 跟随 符号 链接 ， 
所 以 可 以 unlink 文件 foo/testdir。 但 是 如 果 创 建 了 一 个 构成 这 种 循环 的 
硬 链接 ， 那 么 束 很 难 消除 它 。 这 就 是 为 什么 link 芳 数 不 允 许 构 造 指 癌 日 
录 的 硬 链接 的 原因 (除非 进程 具有 超级 用 户 权 限 ) 。 

实际 上 ，Rich Stevens 在 写本 市 的 最 初版 本 时 ， 在 目 己 的 系统 上 做 
了 一 个 这 样 的 实验 。 结 打 文 件 系统 变 得 错误 百出 。 正 第 的 fsck(1) 实 用 
程序 不 能 修复 问题 。 为 了 修复 文件 系统 ， 不 得 不 使 用 了 并 不 推荐 使 用 
的 工具 clri(8) 和 dcheck(8)。 

对 目 孙 的 硬 链接 的 需求 由 来 已 入 ， 但 是 使 用 符号 链接 和 mkdir 画 
数 ， 用 户 就 不 再 需要 创建 指向 目录 的 硬 链接 了 。 

用 open 打 开 文 件 时 ， 如 果 传 递 给 open 函 数 的 路 径 名 指定 了 一 个 符 
号 链接 ， 那 么 open 跟 随 此 链接 到 达 所 指定 的 文件 。 大 此 符号 链接 所 指 
向 的 文件 并 不 存在 ， 则 open 返 回 出 错 ， 表 示 它 不 能 打开 该 文件 。 这 可 
能 会 使 不 熟悉 符号 链接 的 用 户 感到 迷惑 ， 例 如 : 

$ In -s /no/such/file myfile 创建 一 个 符号 链接 

myfile 1s 查 到 该 文件 


$ cat myfile 试图 查看 该 文件 

$ ls myfile 

cat: myfile: No such file or directory 

$ 1s -1 myfile E 

lrwxrwxrwx 1 sar 13 Jan 22 00:26 myfile -> /no/such/file 

文件 myfile 存 在 ， 但 cat 却 称 没有 这 一 文件 。 其 原因 是 myfile 是 个 符 
号 链接 ， 由 该 符号 链接 所 指 同 的 文件 并 不 存在 。1s 命 令 的 -1 选项 给 我 们 
两 个 提示 : 第 一 个 字符 是 1， 它 表示 这 是 一 个 从 号 链接 ， 而 -> 也 表明 这 
AEN SERE s 命令 还 有 男 一 个 达 项 下 ， 它 会 在 符号 链接 的 文件 名 
后 加 一 个 @ 符 号 ， 在 未 使 用 -1 选项 时 ， 这 可 以 帮助 我 们 识别 出 符号 链 


BE 


4.18 创建 和 读 取 符号 链接 


可 以 用 symlink 或 symlinkat 函 数 创 建 一 个 符号 链接 。 

#include <unistd.h> 

int symlink(const char *actualpath, const char *sympath); 

int symlinkat(const char *actualpath, int fd, const char *sympath); 

两 个 范 数 的 返回 值 ， 厦 成功， 返回 0;， 奉 出 错 ， 返 回 -1 

画 数 创建 了 一 个 指 癌 actualpath 的 新 目录 项 sympath。 在 创建 此 符号 
链接 时 ， 并 不 要 求 actualpath 已 经 存在 (在 上 一 市 结束 部 分 的 例子 中 我 
们 已 经 看 到 了 这 一 点 ) 。 并 且 ，actualpath 和 sympath 并 不 需要 位 于 同一 
MFR © 

symlinkatER ZA symlink K, fHsympath 2 ZUR JS TRO] TFT Hr 
文件 描述 符 引 用 的 目录 (由 fd 参数 指定 ) 进行 计算 。 如 果 sympath £ 


数 指定 的 是 绝对 路 径 或 者 fd 参数 设置 了 AT_FDCWD 值 ， 那 么 symlinkat 
WL [n] T-symlinkERZX 。 
Ey open Ex Sue ha FF S HER, Ar Ae Be PT IAT A 
上身， 并 读 该 链接 中 的 名 字 。readlink 和 readlinkat 函 数 提供 了 这 种 功能 。 
#include <unistd.h> 
ssize_t readlink(const char *restrict pathname, char *restrict buf, 
size_t bufsize); 
ssize_t readlinkat(int fd, const char* restrict pathname, 
char *restrict buf, size_t bufsize); 
两 个 函数 的 返回 值 : ÆJ, GREER ek, 者 出 错 ， 返 回 -1 
两 个 函数 组 合 了 open ^ read 和 close 的 所 有 操作 。 如 果 函 数 成 功 执 
行 ， 则 返回 读 入 buf 的 字 节 数 。 在 buf 中 返回 的 符号 链接 的 内 容 不 以 null 
字 节 终止 。 
当 pathname 参数 指定 的 是 绝对 路 径 名 或 者 fd 参数 的 值 为 
AT FDCWD, ，readlinkat 函 数 的 行为 与 readlink 相 同 。 但 是 ， 如 采 fdq 参 数 
是 一 个 打开 目 孙 的 有 效 文件 描述 符 并 且 pathname 参 数 是 相对 路 径 名 ， 
则 readlinkat 计 算 相 对 于 由 fd 代表 的 打开 目录 的 路 径 名 。 


4.19 JAY |B 


在 4.2 节 中 ， 我 们 讨论 了 Single UNIX Specification 2008 年 版 如 何 提 
高 stat 结 构 中 时 间 字 段 的 精度 ， 从 原来 的 秒 提高 到 秒 加 上 纳 秒 。 每 个 文 
件 属 性 所 保存 的 实际 精度 依赖 于 文件 系统 的 实现 。 对 于 把 时 间 戳 记录 
在 秒 级 的 文件 系统 来 说 ， 纳 秒 这 个 字段 束 会 被 填充 为 0。 对 于 时 间 稚 的 
记录 精度 高 于 秒 级 的 文件 系统 来 说 ， 不 足 秒 的 值 被 转换 成 纳 秒 并 记录 
在 纳 秒 这 个 字段 中 。 


对 每 个 文件 维护 3 个 时 间 字 段 ， 它 们 的 意义 示 于 图 4-19 中 。 


st atim 文件 数据 的 最 后 访问 时 间 read -u 
st_mtim 文件 数据 的 最 后 修改 时 间 write 

st ctim i 节点 状态 的 最 后 更 改 时 间 chmod、chown 

图 4-19 与 每 个 文件 相关 的 3 个 时 间 值 

注意 ， 修 改 时 间 (st mtm) 和 状态 更 改 时 间 (st ctim). 之 间 的 区 
别 。 修 改 时 间 是 文件 内 容 最 后 一 次 被 修改 的 时 间 。 状 态 更 改 时 间 是 该 
文件 的 i 节点 最 后 一 次 被 修改 的 时 间 。 在 本 章 中 我 们 已 说 明了 很 多 有 影响 
32 有 i 市 态 的 操作 ， 如 更 改 文件 的 访问 权限 、 更 改 用 户 ID、 更 改 链接 数 
等 ， 但 它们 并 没有 更 改 文件 的 实际 内 容 。 因 为 节点 中 的 所 有 信息 都 古 
与 文件 的 实际 内 容 分 开 存 放 的 ， 所 以 ， 除 了 要 记录 文件 数据 修改 时 间 
以 外 ， 还 需要 记录 状态 更 改 时 间 ， 也 就 是 更 改 i 闻 点 中 信息 的 时 间 。 

注意 ， 系 统 并 不 维护 对 一 个 证 点 的 最 后 一 次 访问 时 间 ， 所 以 access 
和 stat 函 数 并 不 更 改 这 3 个 时 间 中 的 任 一 个 。 

系统 管理 员 第 各 使 用 访问 时 间 来 删除 在 一 定时 间 范 围 内 没有 被 访 
问 过 的 文件 。 典 型 的 例子 是 删除 在 过 去 一 周 内 没有 被 访问 过 的 名 为 
a.out 或 core 的 文件 。find() 命 令 名 被 用 来 进行 这 种 类 型 的 操作 o 

修改 时 间 和 状态 更 改 时间 可 被 用 来 归档 那些 内 容 已 经 被 修改 或 i 市 
点 已 经 被 更 改 的 文件 。 

ls 命令 按 这 3 个 时 间 值 中 的 一 个 排序 进行 显示 。 系 统 默 认 (用 -l 或 -t 
选项 调用 时 ) 是 按 文件 的 修改 时 间 的 先后 排序 显示 。-u 选 项 使 ls 命令 按 
访问 时 间 排 序 ，-c 选 项 则 使 其 按 状 态 更 改 时 间 排 序 。 

图 4-20 列 出 了 我 们 已 说 明 过 的 各 种 函数 对 这 3 个 时 间 的 作用 。 回 忆 
4.14 市 中 所 述 ， 目 录 是 包含 目录 项 (文件 名 和 相关 的 节点 编号 的 文 
件 ， 增 加 、 删 除 或 修改 目录 项 会 影响 到 它 所 在 目录 相关 的 3 个 时 间 。 这 
就 是 在 图 4-20 中 包含 两 列 的 原因 ， 其 中 一 列 是 与 该 文件 (或 目录 ) 相关 


的 3 个 时 间 ， 男 一 列 是 与 所 引用 的 文件 (或 目录 ) 的 父 目录 相关 的 3 个 
时 间 。 例 如 ， 创 建 一 个 新 文件 影响 到 包含 此 新 文件 的 目录 ， 也 影响 该 
新 文件 的 节点。 但 是 ， 读 或 写 一 个 文件 只 影响 该 文件 的 i 节点， 而 对 目 


录 则 无 影响 。 
引用 的 文件 或 目录 所 引用 文件 或 目录 


O CREAT 新 文件 

O TRUNC 现 有 文件 
第 二 个 参数 的 父 目 录 

O CREAT 新 文件 

à O TRUNC 现 有 文件 
删除 文件 = unlink 
删除 目录 = rmdir 
对 于 两 个 参数 


chmod. fchmod 
chown, fchown 
creat 

creat 

exec 

lchown 

link 

mkdir 

mkfifo 

open 

open 

pipe 

read 

remove 
remove 
rename 

rmdir 
truncate, ftruncate 
unlink 
utimes, utimensat. 
futimens 
write 


图 4-20 各 种 函数 对 访问 、 修 改 和 状态 更 改 时 间 的 作用 


( mkdir FU rmdir ER Žr f E 4.21 15 "P ii BH © utimes ^ utimensat ^ 
futimens KCK E F — E Pim 9 77 exec IN AU TEB.10 9 "PEE 9» $815 
= B ImkfifofllpipeERZA » ) 


4.20 utimens ^ utimensat7#utimes 


一 个 文件 的 访问 和 修改 时 间 可 以 用 以 下 几 个 函数 更 改 。futimens 和 
utimensat 函 数 可 以 指定 纳 秒 级 精度 的 时 间 戳 。 用 到 的 数据 结构 是 与 stat 
函数 族 相同 的 timespec 结 构 (14.277) 

#include <sys/stat.h> 

int futimens(int fd, const struct timespec times[2]); 

int utimensat(int fd, const char *path, const struct timespec times[2], int 
flag); 

PT EBORE: €D, eo; 者 出 错 ， 返 回 -1 

这 两 个 芳 数 的 times 数 组 参数 的 第 一 个 元 素 包 含 访问 时 间 ， 第 二 元 
素 包含 修改 时 间 。 这 两 个 时 间 值 是 日 历时 间 ， 如 1.10 节 所 述 ， 这 是 自 特 
定时 间 (1970 年 1 月 1 日 00:00:00) 以 来 所 经 过 的 秒 数 。 不 足 秒 的 部 分 用 
纳 秒表 示 。 

时 间 鹤 可 以 按 下 列 4 种 方式 之 一 进行 指定 。 

(1) 如 果 times 参 数 是 一 个 空 指针 ， 则 访问 时 间 和 修改 时 间 两 者 都 
设置 为 当前 时 间 。 

(2) 如 果 times 参 数 指向 两 个 timespec 结 构 的 数组 ， 任 一 数组 元 素 
的 tv_nsec 字 段 的 值 为 UTIME_NOW， 相 应 的 时 间 惟 就 设置 为 当前 时 
lA], ZARA AEDT AN tv_secEx ° 

(3) 如 果 times 参 数 指向 两 个 timespec 结 构 的 数组 ， 任 一 数组 元 素 
的 tv_nsec 字 段 的 值 为 UTIME_OMIT， 相 应 的 时 间 戳 保持 不 变 ， 忽 略 相 
应 的 tv_sec 字 段 。 

(4) 如 果 times 参数 指向 两 个 timespec 结构 的 数组 ， 且 tv_nsec 字 
段 的 值 为 既 不 是 UTIME_NOW 也 不 是 UTIME_OMIT， 在 这 种 情况 下 ， 
相应 的 时 间 惟 设置 为 相应 的 tv. sec 和 tv_nsec 字 上 段 的 值 。 


执行 这 些 函 数 所 要 求 的 优 移 权 取 决 于 times 参 数 的 值 。 

- Ul R times 是 一 个 空 指 针 ， 或 者 任 一 tvnsec 字 段 设 为 
UTIME_NOW， 则 进程 的 有 效用 户 ID 必须 等 于 该 文件 的 所 有 者 ID; Xf 
程 对 该 文件 必须 具有 写 权 限 ， 或 者 进程 是 一 个 超级 用 户 进 程 。 

。 如 采 times 是 非 空 指针 ， 并 且 任 一 tv. nsec 字段 的 值 既 不 是 
UTIME NOW 也 不 是 UTIME_OMIT， 则 进程 的 有 效用 户 ID 必须 等 于 该 
文件 的 所 有 者 ID ， 或 者 进程 必须 是 一 个 超级 用 户 进 程 。 对 文件 只 具有 
写 权 限 是 不 够 的 。 

- ll R times Æ JE Z 4 tb, Jf EAS tv nsec ^£ Ex HY 1E b ON 
UTIME_OMIT， 就 不 执行 任何 的 权限 检查 9 

futimens 函数 需要 打开 文件 来 更 改 它 的 时 间 ，utimensat 函数 提供 
了 一 种 使 用 文件 名 更 改 文 件 时 间 的 方法 。pathname 人 参数 是 相对 于 fd 参数 
进行 计算 的 ，fd 要 么 是 打开 目录 的 文件 描述 符 ， 要 么 设置 为 特殊 值 
AT_FDCWD (强制 通过 相对 于 调用 进程 的 当前 目录 计算 pathname) 。 
如 果 pathname 指 定 了 绝对 路 径 ， 那 么 fd 参数 被 忽略 。 

utimensat 的 flag 参 数 可 用 于 进一步 修改 默认 行为 。 如 采 设 置 了 
AT_SYMLINK_NOFOLLOW 标 志 ， 则 符号 链接 本 号 的 时 间 束 会 被 修改 

(如 果 路 径 名 指向 符号 链接 ) 。 默 认 的 行为 是 跟随 符号 链接 ， 并 把 文 
件 的 时 间 改 成 符号 链接 的 时 间 。 

futimens 和 utimensat 函数 都 包含 在 POSIX.1 F, 583 个 函数 utimes 

包含 在 Single UNIX Specification 的 XSI 扩 展 选 项 中 。 


#include <sys/time.h> 


int utimes(const char *pathname, const struct timeval times[2]); 
SORE: ERD, welo; 者 出 错 ， 返 回 -1 
utimes 函 数 对 路 径 名 进行 操作 。times 参 数 是 指向 包含 两 个 时 间 惟 
(访问 时 间 和 修改 时 间 ) 元 素 的 数组 的 指针 ， 两 个 时 间 戳 是 用 秒 和 微 
妙 表 示 的 。 


struct timeval 1 
time ttv sec; /* seconds */ 
long tv. usec; /* microseconds */ 
h 
注意 ， 我 们 不 能 对 状态 更 改 时 间 st_ctim GT Beat BEB A 
H) 指定 一 个 值 ， 因 为 调用 utimes 画 数 时 ， 此 字段 会 被 自动 更 新 。 
TEE EEUNIXRBIU F^, touch(1) fii S18 FH 3o Ea INSET o 25 
Sh, PREVA TS Fee tar(1) Al cpio(1) 8] 3638 78] A ee RB, | BLUE 3C 
件 的 时 间 值 设置 为 将 它 归 档 时 保存 的 时 间 。 
实例 
图 4-21 的 程序 使 用 带 O_TRUNC 选 项 的 open 函 数 将 文件 长 度 截 断 为 
0， 但 并 不 更 改 其 访问 时 间 及 修改 时 间 。 为 了 做 到 这 一 点 ， 百 先 用 stat 
函数 得 到 这 些 时 间 ， 然 后 截断 文件 ， 最 后 再 用 futimens 函 数 重 置 这 两 个 
时 间 。 可 以 用 以 下 Linux 命 令 演 示 图 4-21 中 的 程序 : 


#include "apue.h" 
#include <fcntl.h> 


int 

main(int argc, char *argv[]) 

{ 
int i, fd; 
struct stat statbuf; 
struct timespec times[2]; 


for (f= 1j L1 € aeger ast) { 
if (stat(argv[i], &statbuf) « 0) ( /* fetch current times */ 
err ret("$s: stat error", argv[i]); 
continue; 
} 
if ((fd = open(argv[i], O_RDWR | O TRUNC)) < 0) { /* truncate */ 
err ret("$s: open error", argv[i]); 
continue; 
} 
times[0] = statbuf.st_atim; 
times[1] = statbuf.st mtim; 
if (futimens(fd, times) « 0) /* reset times */ 
err ret("$s: futimens error", argv[i]); 
close(fd); 
} 
exit 0); 


图 4-21 futimens ERAS fi] 


$ Is -I changemod times 查看 长 度 和 最 后 修改 时 间 

-rwxr-xr-x 1 sar 13792 Jan 22 01:26 changemod 

-rwxr-xr-x 1 sar 13824 Jan 22 01:26 times 

$ Is -lu changemod times 查看 最 后 访问 时 间 

-rwxr-xr-x 1 sar 13792 Jan 22 22:22 changemod 

-rwxr-xr-x 1 sar 13824 Jan 22 22:22 times 

$ date 打印 当天 日 期 Fri Jan 27 

20:53:46 EST 2012 


$ ./a.out changemod times 运行 图 4-21 的 程序 
$ Is -1 changemod times 检查 结 
-IWXI-XI-X 1 sar 0 Jan 22 01:26 changemod 


-IWXI-XI-X 1 sar 0 Jan 22 01:26 times 


$ Is -lu changemod times 仿 查 最 后 访问 时 间 


-IWXI-XI-X 1 sar 0 Jan 22 22:22 changemod 
-rWxr-xr-x 1 sar 0 Jan 22 22:22 times 

$ Is -Ic changemod times 检查 状态 更 改 时 间 
-IWXI-XI-X 1 sar 0 Jan 27 20:53 changemod 
-rWxr-xr-x 1 sar 0 Jan 27 20:53 times 


正如 我 们 所 预见 的 一 样 ， 最 后 修改 时 间 和 最 后 访问 时 间 未 变 。 但 
， 状 态 更 改 时 间 则 更 改 为 程序 运行 时 的 时 间 。 


au 


4.21 kdir ` mkdirat7Urmdir 


用 mkdir 和 mkdirat 函 数 创建 目 孙 ， 用 rmdir 函 数 删 除 目 孙 。 

#include <sys/stat.h> 

int mkdir(const char *pathname, mode_t mode); 

int mkdirat(int fd, const char *pathname, mode_t mode); 

PATERSON: €D, allo; 者 出 错 ， 返 回 -1 

这 两 个 函数 创建 一 个 新 的 空 目 孙 。 其 中 ，. 和 .. 目 录 项 是 自动 创建 
的 。 所 指定 的 文件 访问 权限 mode 由 进程 的 文件 模式 创建 屏蔽 字 修 改 。 

常见 的 错误 是 指定 与 文件 相同 的 mode (只 指定 读 、 写 权限 ) 。 但 
是 ， 对 于 日 录 通 第 至 少 要 设置 一 个 执行 权限 位 ， 以 允许 访问 该 日 录 中 
的 文件 名 (见习 题 4.16) 

按照 4.6 广 中 讨论 的 规则 来 设置 新 目录 的 用 户 ID 和 组 ID。 

Solaris 10 和 Linux 3.2.0 也 使 新 目录 继承 父 目 录 的 设置 组 ID 位 。 这 就 
使 得 在 新 目录 中 创建 的 文件 将 继承 该 目录 的 组 ID。 对 于 Linux， 文 件 系 
统 的 实现 决定 是 否 文 持 此 特征 。 例 如 ，ext2、ext3 和 ext4 文 件 系统 
mount() 命 令 的 一 个 选项 来 控制 是 否 文 持 此 特征 。 但 是 ，Linux 的 UFS 


文件 系统 实现 则 是 不 可 选择 的 ， 新 目录 继承 父 目录 的 设置 组 ID 位 ， 这 
仿效 了 历史 上 BSD 的 实现 。 在 BSD 系 统 中 ， 新 目录 的 组 ID 是 从 父 目 录 
继承 的 。 

基于 BSD 的 系统 并 不 要 求 在 目录 间 传 递 设置 组 ID 位 ， 因 为 不 论 设 
置 组 ID 位 如 何 ， 新 创建 的 文件 和 目录 总 是 继承 父 目录 的 组 ID。 因 为 
FreeBSD 8.0 和 Mac OS X 10.6.8 是 基于 4.4BSD 的 ， 它 们 不 要 求 继承 设置 
组 ID 位 。 在 这 些 平台 上 ， 新 创建 的 文件 和 目录 总 是 继承 父 目 录 的 组 
ID， 这 与 是 否 设置 了 设置 组 ID 位 无 关 。 

早期 的 UNIX 版 本 并 没有 mkdir 函 数 ， 它 是 由 4.2BSD 和 SVR3 引 入 
的 。 在 早期 版 本 中 ， 进 程 要 调用 mknod 函 数 创建 一 个 新 目录 ， 但 是 只 有 
超级 用 户 进程 才能 使 用 mknod 函 数 。 为 了 避免 这 一 点 ， 创 建 目 孙 的 命令 
mkdir() 必 须 由 根 用 户 拥 有 ， 而 且 对 它 设 置 了 设置 用 户 ID 位 。 要 通过 一 
个 进程 创建 一 个 目录 ， 必 须 用 system(3) 函 数 调用 mkdir(1) 命 令 。 

mkdirat 函 数 与 nkdir 函 数 类 似 。 当 fd 参数 具有 特殊 值 AT_FDCWD 或 
者 pathname 参 数 指定 了 绝对 路 径 名 时 ，mkdirat 与 mkdir 完 全 一 样 。 人 否 
则 ，fd 参 数 是 一 个 打开 目录 ， 相 对 路 径 名 根据 此 打开 目录 进行 计算 。 

用 rmdir 函 数 可 以 删除 一 个 空 目录 。 空 目录 是 只 包含 .和 .. 这 两 项 的 
目录 。 


#include <unistd.h> 


int rmdir(const char *pathname); 
IRENE: ARH, welo 看 出 错 ， 返 回 -1 
如 果 调 用 此 函数 使 目录 的 链接 计数 成 为 0， 并 且 也 没有 其 他 进程 打 
开 此 目录 ， 则 释放 由 此 目录 占用 的 空间 。 如 末 在 链接 计数 达到 0 时 ， 有 
一 个 或 多 个 进程 打开 此 目录 ， 则 在 此 函数 返回 前 删除 最 后 一 个 链接 及 . 
和 .. 项 。 男 外 ， 在 此 目录 中 不 能 再 创建 新 文件 。 但 是 在 最 后 一 个 进程 天 
闭 它 之 前 并 不 释放 此 目录 。 (即使 男 一 些 进程 打开 该 目录 ， 它 们 在 此 
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功 执 行 ， 该 目录 必须 是 空 的 。) 


4.22 读 目 录 


对 某 个 目录 具有 访问 权限 的 任 一 用 户 都 可 以 读 该 目录 ， 但是， 为 
了 防止 文件 系统 产生 混乱 ， 只 有 内 核 才 能 写 目录 。 回 忆 4.5 节 ， 一 个 目 
录 的 写 权 限 位 和 执行 权限 位 决定 了 在 该 目录 中 能 否 创 建新 文件 以 及 删 
除 文 件 ， 它 们 并 不 表示 能 否 写 目录 本 身 。 

目录 的 实际 格式 依赖 于 UNIX 系统 实现 和 文件 系统 的 设计 。 早 期 
的 系统 (如 V7) 有 一 个 比较 简单 的 结构 : 每 个 目录 项 是 16 个 字 节 ， 其 
中 14 个 字 布 是 文件 名 ，2 个 字 布 是 证 点 编号 。 而 对 于 4.2BSD ， 由 于 它 
允许 更 长 的 文件 名 ， 所 以 每 个 目录 项 的 长 度 是 可 变 的 。 这 就 意味 着 读 
目录 的 程序 与 系统 相关 。 为 了 简化 读 目 孙 的 过 程 ，UNIX 现在 包含 了 一 
套 与 目录 有 关 的 例 程 ， 它 们 是 POSIX.1 的 一 部 分 。 很 多 实现 阻止 应 用 程 
序 使 用 read 函 数 读 取 目 录 的 内 容 ， 由 此 进一步 将 应 用 程序 与 目录 格式 中 
与 实现 相关 的 细节 隔离 。 


#include <dirent.h> 


DIR *opendir(const char *pathname); 
DIR *fdopendir(int fd); 
两 个 函数 返回 值 : ERD, REJ; Aoife, JAK[BINULL 
struct dirent *readdir(DIR *dp); 
返回 值 : ARJ, REFE: ate Boe te, XX[BINULL 
void rewinddir(DIR *dp); 
int closedir(DIR *dp); 


返回 值 : ERD, wE 大 出 错 ， 返 回 -1 


long telldir(DIR *dp); 
返回 值 ， 与 dp 关联 的 目录 中 的 当前 位 置 

void seekdir(DIR *dp, long loc); 

fdopendir 函数 最 早出 现在 SUSv4 (Single UNIX Specification 第 4 
版 ) 中 ， 它 提供 了 一 种 方法 ， 可 以 把 打开 文件 描述 符 转 换 成 目录 处 理 
函数 需要 的 DIR 结 构 。 

telldir 和 seekdir 函数 不 是 基本 POSIX.1 标准 的 组 成 部 分 。 它 们 是 
Single UNIX Specification 中 的 XSI 扩 展 ， 所 以 可 以 期 望 所 有 符合 UNIX 
系统 的 实现 都 会 提供 这 两 个 函数 。 

回忆 一 下 ， 在 图 1-3 程 序 中 〈ls 命 令 的 基本 实现 部 分 ) 使 用 了 其 中 
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定义 在 头 文件 <dirent,h> 中 的 dirent 结 构 与 实现 有 关 。 实 现 对 此 结构 
所 做 的 定义 至 少 包含 下 列 两 个 成 员 : 


ino td ino; /* ji-node number */ 


char d namel[]; /* null-terminated filename */ 

POSIX.1 并 没有 定义 d_ino 项 ， 因 为 这 是 一 个 实现 特征 ， 但 在 
POSIX.1 的 XSI 扩 展 中 定义 了 d_ino。POSIX.1 在 此 结构 中 只 定义 了 
d_name 项 。 

注意 ，d_name 项 的 大 小 并 没有 指定 ， 但 必须 保证 它 能 包含 至 少 
NAME_MAX 个 字 节 (不 包含 终止 null 字 节 ， 回 忆 图 2-15) 。 因 为 文件 
名 是 以 null 字 市 结束 的 ， 所 以 在 头 文件 中 如 何 定义 数组 d_name 并 无 多 大 
关系 ;数组 大 水 放 不 表示 区 作 各 的 长 度 * 

DIR 结构 是 一 个 内 部 结构 ， 上 述 7 个 函数 用 这 个 内 部 结构 保存 当 
前 正在 补 读 的 日 隶 的 有 关 信 筷 。 其 作用 类 似 于 FILE 结 构 。FILE 结 构 由 
标准 VO 库 维 护 ， 我 们 将 在 第 5 章 中 对 它 进行 说 明 。 

由 opendir 和 fdopendir 返 回 的 指向 DIR 结 构 的 指针 由 男 外 5 个 函数 使 
用 。opendir 执 行 初始 化 操作 ， 使 第 一 个 readdir 返 回 目录 中 的 第 一 个 目 


录 项 。DIR 结 构 由 fdopendir 创 建 时 ，readdir 返 回 的 第 一 项 取决 于 传 给 
fdopendir 函 数 的 文件 描述 符 相 关联 的 文件 偏 移 量 。 注 意 ， 目 录 中 各 目 
录 项 的 顺序 与 实现 有 关 。 它 们 通常 并 不 按 字母 顺序 排列 。 

实例 

我 们 将 使 用 这 些 对 目录 进行 操作 的 例 程 编写 一 个 遍历 文件 层次 结 
构 的 程序 ， 其 目的 是 得 到 如 图 4-4 中 所 示 的 各 种 类 型 的 文件 计数 。 图 4- 
22 的 程序 只 有 一 个 参数 ， 它 说 明 起 点 路 径 名 ， 从 该 点 开始 递归 降序 遍 
历 文件 层次 结构 。Solaris 提 供 了 一 个 遍历 此 层次 结构 的 函数 ftw(3)， 对 
于 每 一 个 文件 它 都 调用 一 个 用 户 定义 的 函数 。ftw 函数 的 问题 是 ， 对 于 
每 一 个 文件 ， 它 都 调用 stat 函 数 ， 这 就 使 程序 跟随 符号 链接 。 例 如 ， 如 
果 从 根 目 录 (root) 开始 ， 并 且 有 一 个 名 为 /lib 的 符号 链接 ， 它 指 
回 /usrvlib， 则 所 有 在 目 孙 /swlib 中 的 文件 都 会 被 计数 两 次 。 为 了 纠正 这 
一 点 ，Solaris 提供 了 另 一 个 函数 nftw(3)， 它 具有 一 个 停止 跟随 符号 链 
接 的 选项 。 尺 管 可 以 使 用 nftw， 但 是 为 了 说 明 目 录 例 程 的 使 用 方法 ， 我 
们 还 是 编写 了 一 个 简单 的 文件 遍历 程序 。 

在 SUSv4 中 ，nftw 包 含 在 XSI 选 项 中 。FreeBSD 8.0 ` Linux 3.2.0 ^ 
Mac OS X 10.6.8 以 及 Solaris 10 都 包括 了 该 画 数 的 实现 。 (在 SUSvV4 
中 ，ftw 函 数 已 被 标记 为 弃 用 。) 基于 BSD 的 UNIX 系 统 则 有 另 一 个 函数 
fts(3)， 它 提供 类 似 的 功能 。 该 函数 在 FreeBSD 8.0 ` Linux 3.2.0 和 Mac 
OS X 10.6.8 中 是 可 用 的 。 


#include "apue.h" 
#include <dirent.h> 
#include <limits.h> 


/* function type that is called for each filename */ 
typedef int Myfunc(const char *, const struct stat *, int); 


static Myfunc myfunc; 

static int myftw(char *, Myfunc *); 

static int dopath (Myfunc *); 

static long nreg, ndir, nblk, nchr, nfifo, nslink, nsock, ntot; 


int 
main(int argc, char *argv[]) 
{ 
int ret; 
if (arge != 2) 
err quit("usage: ftw <starting-pathname>") ; 
ret = myftw(argv[1], myfunc); /* does it all */ 
ntot = nreg + ndir + nblk + nchr + nfifo + nslink + nsock; 
if (ntot == 0) 
ntot = 1; /* avoid divide by 0; print 0 for all counts */ 
printf("regular files = %7ld, $5.2f %%\n", nreg, 
nreg*100.0/ntot); 
printf ("directories = $71d, $5.2f %%\n", ndir, 
ndir*100.0/ntot); 
printf("block special = $71d, $5.2f %%\n", nblk, 
nblk*100.0/ntot); 
printf("char special 
nchr*100.0/ntot); 
printf ("FIFOs = $71d, $5.2f %%\n", nfifo, 
nfifo*100.0/ntot); 
printf("symbolic links = $71d, %5.2f %%\n", nslink, 
nslink*100.0/ntot); 
printf ("sockets = $71d, $5.2f %%\n", nsock, 
nsock*100.0/ntot); 
exit (ret); 


$71d, $5.2f %%\n", nchr, 


} 

/* 
* Descend through the hierarchy, starting at "pathname". 
* The caller's func() is called for every file. 


ad 

#define FTW F 1 /* file other than directory */ 

#define FTW D 2 /* directory */ 

#define FTW_DNR 3 /* directory that can't be read */ 

#define FTW NS 4 /* file that we can't stat */ 

static char *fullpath; /* contains full pathname for every file */ 


static size_t pathlen; 


static int /* we return whatever func() returns */ 
myftw(char *pathname, Myfunc *func) 
{ 
fullpath = path_alloc(&pathlen); /* malloc PATH_MAX+1 bytes */ 
/* ({Flgure 2.16}) */ 
if (pathlen <= strlen(pathname)) { 
pathlen = strlen(pathname) * 2; 
if ((fullpath = realloc(fullpath, pathlen)) == NULL) 
err_sys("realloc failed"); 


*/ 


) 
strcpy(fullpath, pathname); 
return (dopath (func) ); 


Descend through the hierarchy, starting at "fullpath". 

If "fullpath" is anything other than a directory, we lstat() it, 
call func(), and return. For a directory, we call ourself 
recursively for each name in the directory. 


Static int /* we return whatever func() returns */ 


dopath (Myfunc* func) 


{ 


} 


struct stat statbuf; 
struct dirent *dirp; 
DIR *dp; 
int ret, ns 


if (lstat(fullpath, &statbuf) « 0) /* stat error */ 
return(func(fullpath, &statbuf, FTW NS)); 
if (S ISDIR(statbuf.st mode) -- 0) /* not a directory */ 
return(func(fullpath, &statbuf, FTW F)); 
/* 
* It's a directory. First call func() for the directory, 
* then process each filename in the directory. 
xf 
if ((ret = func(fullpath, &statbuf, FTW D)) !- 0) 
return(ret); 
n = strlen(fullpath); 
if (n + NAME MAX + 2 > pathlen) ( /* expand path buffer */ 
pathlen *= 2; 
if ((fullpath = realloc(fullpath, pathlen)) == NULL) 
err sys("realloc failed"); 


) 


fullpath[n++] = '/'; 
fullpath[n] = 0; 
if ((dp = opendir(fullpath)) == NULL) /* can't read directory */ 
return(func(fullpath, &statbuf, FTW DNR)); 
while ((dirp = readdir(dp)) != NULL) { 
if (stremp(dirp-»d name, ".") == 0 | 
strcmp(dirp-»d name, "..") == 0) 
continue; /* ignore dot and dot-dot */ 
strcpy(&fullpath[n], dirp-»d name); /* append name after "/" */ 
if ((ret = dopath(func)) != 0) /* recursive */ 


break; /* time to leave */ 
} 
fullpath[n-1] = 0; /* erase everything from slash onward */ 
if (closedir(dp) < 0) 
err_ret("can't close directory %s", fullpath); 
return (ret); 


static int 
myfunc(const char *pathname, const struct stat *statptr, int type) 


{ 


switch (type) { 


case FTW F: 

switch (statptr-»st mode & S IFMT) { 

case S IFREG: nregtt+; break; 

case S IFBLK: nblk++; break; 

case S_IFCHR: nchr++; break; 

case S_IFIFO: nfifot++; break; 

case S_IFLNK: nslink++; break; 

case S_IFSOCK: nsock++; break; 

case S IFDIR: /* directories should have type = FTW D */ 


err_dump("for S_IFDIR for %s", pathname) ; 
} 
break; 
case FTW D: 
ndir++; 
break; 
case FTW_DNR: 
err_ret("can't read directory %s", pathname) ; 
break; 
case FTW_NS: 
err_ret("stat error for %s", pathname) ; 
break; 
default: 
err_dump ("unknown type $d for pathname $s", type, pathname) ; 
} 


return (0); 


图 4-22 递归 降序 遍历 目录 层次 结构 ， 并 按 文件 类 型 计数 

在 程序 中 ， 我 们 提供 了 比 所 要 求 的 更 多 的 通用 性 ， 这 样 做 的 目的 
是 为 了 具体 说 明 ftw 和 nftw 琴 数 的 和 应用。 例如， 函数 myfunc 总 是 返回 0， 
即使 调用 它 的 函数 准备 了 处 理 非 0 返 回 也 是 如 此 。 

关于 降序 壳 历 文件 系统 的 更 多 信息 ， a 令 
(如 find、ls、tar 等 ) 中 使 用 这 种 技术 的 情况 ， 请 参阅 Fowler、Korn 和 
Vo[1989] ° 


4.23 chdir ` fchdirzlgetcwd 


每 个 进程 都 有 一 个 当前 工作 目录 ， 此 目录 是 搜索 所 有 相对 路 径 名 
的 起 点 (不 以 斜 线 开始 的 路 径 名 为 相对 路 径 名 ) 。 当 用 户 登 录 到 UNIX 
系统 时 ， 其 当前 工作 目录 通常 是 口令 文件 (etc/passwd) 中 该 用 户 登 录 
项 的 第 6 个 字段 一 用 户 的 起 始 目 录 (home directory) 。 当 前 工作 目录 是 
进程 的 一 个 属性 ， 起 始 目 录 则 是 登录 名 的 一 个 属性 。 

进程 调用 chdir 或 fchdir 函 数 可 以 更 改 当前 工作 目录 。 


#include <unistd.h> 


int chdir(const char *pathname); 
int fchdir(int fd); 
两 个 函数 的 返回 值 : TERRE), eo 在 出 错 ， 返 回 -1 

在 这 两 个 函数 中 ， 分 别 用 pathname 或 打开 文件 描述 符 来 指定 新 的 
当前 工作 目录 ° 

实例 

因为 当前 工作 目 永 是 进程 的 一 个 属性 ， 所 以 它 只 影 啊 调 用 chdir 的 
进程 本 号 ， 而 不 影响 其 他 进程 《我们 将 在 第 8 章 更 详细 地 说 明 进 程 之 间 
的 关系 ) 。 这 就 意味 着 图 4-23 的 程序 并 不 会 产生 我 们 可 能 希望 得 到 的 结 
果 。 


#include "apue.h" 


err sys("chdir failed"); 


图 4-23 chdirER Zi S ffi 

如 采编 译 图 4-23 程 序 ， 并 且 调 用 其 可 执行 目标 代码 文件 mycd， 则 
可 以 得 到 下 列 结 

$pwd 


/usr/lib 

$ mycd 

chdir to /tmp succeeded 

$ pwd 

/usr/lib 

从 中 可 以 看 出 ， 执 行 mycd 命 令 的 shell 的 当前 工作 目录 并 没有 改 
变 ， 这 是 shell 执 行程 序 工作 方式 的 一 个 副作用 。 每 个 程序 运行 在 独立 
的 进程 中 ，shell 的 当前 工作 目录 并 不 会 随 着 程序 调用 chdir 而 改变 。 由 
此 可 见 ， 为 了 改变 shell 进 程 自己 的 工作 目录 ，shell 应 当 直 接 调用 chdir 函 
数 ， 为 此 ，cd 命 令 内 建 在 shell 中 。 

因为 内 核 必须 维护 当前 工作 目录 的 信息 ， 所 以 我 们 应 能 获取 其 当 
前 值 。 遗 憾 的 是 ， 内 核 为 每 个 进程 只 保存 指向 该 目录 v 市 点 的 指针 等 
目 隶 本身 的 信息 ， 并 不 保存 该 目录 的 完整 路 笃 名 。 

Linux 内 核 可 以 确定 完整 路 径 名 。 完 整 路 径 名 的 各 个 组 成 部 分 分 布 
在 mount 表 和 dcache 表 中 ， 然 后 进行 重新 组 锋 ， 比 如 在 读 
取 /proc/self/cwd 和 从 号 链接 时 。 

我 们 需要 一 个 函数 ， 它 从 当前 工作 目录 () 开始 ， 用 .. 找 到 其 上 一 
MAK, SERA, BAZAR Aas SLE RIT 
AV HII. OEE ET BO ACE o FLAIR TIA, XE 
EB, BEES, PRS TS a LTEHGKSOREBUTEONI ES o 
IRA, HK Wgetcwdytte Bt Fixe AE ° 


#include <unistd.h> 


char *getcwd(char *buf, s i z e_t size); 
返回 值 ， 若 成 功 ， 返 回 buf; 着 出 错 ， 返 回 NULL 
必须 回 此 函数 传递 两 个 参数 ， 一 个 是 缓冲 区 地 址 buf， 另 一 个 是 缓 
冲 区 的 长 度 size (以 字 节 为 单位 ) 。 该 缓冲 区 必须 有 足够 的 长 度 以 容纳 


绝对 路 径 名 再 加 上 一 个 终止 null FP, dE GBIBIT52.5.5 5 
中 有 关 为 最 大 长 度 路 径 名 分 配 空间 的 讨论 ) 。 

某 些 getcwd 的 早期 实现 允许 第 一 个 参数 buf 为 NULL。 在 这 种 情况 
下 ， 此 函数 调用 malloc 动 态 地 分 配 size 字 节 数 的 空间 。 这 不 是 POSIX.1 
或 Single UNIX Specification 的 所 属 部 分 ， 应 当 避 免 使 用 。 

实例 

图 4-24 的 程序 将 工作 目录 更 改 至 一 个 指定 的 目录 ， 然 后 调用 


getcwd， 最 后 打印 该 工作 目录 。 如 果 运 行 该 程序 ， 则 可 得 


$ ./a.out 


cwd = /var/spool/uucppublic 
$ Is -l /usr/spool 


Irwxrwxrwx 1 root 12 Jan 31 07:57 /usr/spool -> ../var/spool 


#include "apue.h" 
int 
main (void) 
{ 
char “ptr; 
size_t size; 
if (chdir("/usr/spool/uucppublic") < 0) 
err_sys("chdir failed"); 
ptr = path alloc(&size); /* our own function */ 
if (getcwd(ptr, size) == NULL) 
err_sys("getcwd failed"); 
printf ("cwd = %s\n", ptr); 
exit (0); 


图 4-24 getcwd EH 23 SZ [Pl] 

注意 ，chdir 跟 随 符号 链接 (正如 我 们 希望 的 ， 如 图 4-17 中 所 
c) ， 但 是 当 getcwd 沿 目录 树 上 漳 遇 到 /varspool 目录 时 ， 它 并 不 了 解 
该 目录 由 符号 链接 /usr/spool 所 指 问 。 这 是 符号 链接 的 一 种 特性 。 

当 一 个 应 用 程序 需要 在 文件 系统 中 返回 到 它 工作 的 出 发 点 时 ， 
getcwd 辆 数 是 有 用 的 。 在 更 换 工 作 目 录 之 前 ， 我 们 可 以 调用 getcwd 函 
数 先 将 其 你 存 起 来 。 在 完成 了 处 理 后 ， 就 可 将 所 保存 的 原 工 作 目 录 路 


径 名 作为 调用 参数 传送 给 chdir， 这 样 吏 返回 到 了 文件 系统 中 的 出 发 
A, o 

fchdir 函 数 回 我 们 提供 了 一 种 完成 此 任务 的 便捷 方法 。 在 更 换 到 文 
件 系统 中 的 不 同位 置 前 ， 无 需 调用 getcwd 函 数 ， 而 是 使 用 open 打 开 当 前 
工作 目录 ， 然 后 保存 其 返回 的 文件 接 述 符 。 当 希望 回 到 原 工作 目 邓 
时 ， 只 要 简单 地 将 该 文件 接 述 符 传 送 给 fchdir 。 


4.24 设备 特殊 文件 


st_dev 和 st_rdev 这 两 个 字段 经 常 引 起 混 消 ， 在 18.9 太 ， 我 们 编写 
ttyname 芳 数 时 ， 需 要 使 用 这 两 个 字段 。 有 关 规 则 很 简单 : 

“每 个 文件 系统 所 在 的 存储 设备 都 由 其 主 、 次 设备 号 表示 。 设 备 号 
所 用 的 数据 类 型 是 基本 系统 数据 类 型 dev_ t。 主 设备 号 标识 设备 驱动 程 
序 ， 有 时 编码 为 与 其 通信 的 外 设 板 ; 次 设备 号 标识 特定 的 子 设备 。 回 
忆 图 4-13， 一 个 磁 强 张 动 器 经 常 包 含 知 干 个 文件 系统 。 在 同一 倍 盘 张 动 
器 上 的 各 文件 系统 通常 具有 相同 的 主 设备 号 ， 但 是 次 设备 号 却 不 同 。 

我们 通常 可 以 使 用 两 个 宏 : major 和 minor 来 访问 主 、 次 设备 与 ， 
大 多 数 实 现 都 定义 这 两 个 宏 。 这 就 意味 着 我 们 无 需 关 心 这 两 个 数 是 如 
何 存放 在 dev_t 对 象 中 的 。 

早期 的 系统 用 16 位 整 型 存放 设备 号 : 8 位 用 于 主 设 备 号 ，8 位 用 于 
次 设备 号 。FreeBSD 8.0 和 Mac OS X 10.6.8 使 用 32 位 整 型 ， 其 中 8 位 表示 
主 设备 号 ，24 位 表示 次 设备 号 。 在 32 位 系统 中 ，Solaris 10 用 32 位 整 型 
表示 dev_t， 其 中 14 位 用 于 主 设备 号 ，18 位 用 于 次 设备 号 。 在 64 位 系统 
中 ，Solaris 10 用 64 位 整 型 表示 dev_t， 主 设备 号 和 次 设备 号 各 用 其 中 的 
32 位 表示 。 在 Linux 3.2.0 上 ， 虽 然 dev_t 是 64 位 整 型 ， 但 其 中 只 有 12 位 用 
于 主 设备 号 ，20 位 用 于 次 设备 号 。 


POSIX.1 说 明 dev_t 类 型 是 存在 的 ， 但 没有 定义 它 包含 什么 ， 或 如 何 
取得 其 内 容 。 大 多 数 实现 定义 了 宏 major 和 minor， 但 在 哪 一 个 头 文 件 中 
定义 它们 则 与 实现 有 天 。 基 于 BSD 的 UNIX 系 统 将 它们 定义 在 
<sys/types> 中 。 Solaris 在 <sysmkdevh> 中 定义 了 它们 的 函数 原型 , 
为 在 <sys/sysmacros.h> 中 的 安定 义 都 痉 用 了 。Linux 将 它们 定义 在 
<Sys/sysmacros.h> 中 ， 而 该 头 文 件 又 包含 在 <sys/type.h> 中 。 

系统 中 与 每 个 文件 名 关联 的 st dev 值 是 文件 系统 的 设备 号 ， 该 文 
件 系统 包含 了 这 一 文件 名 以 及 与 其 对 应 的 FE 点。 

“只 有 字符 特殊 文件 和 块 特殊 文件 才 有 st_rdev 值 。 此 值 包含 实际 设 
备 的 设备 号 。 

实例 

图 4-25 的 程序 为 每 个 命令 行 参 数 打印 设备 号 ， 男 外 ， 若 此 参数 引用 
的 是 字符 特殊 文件 或 块 特 殊 文件 ， 则 还 打印 该 特殊 文件 的 st_rdev 值 。 


finclude "apue.h" 
#ifdef SOLARIS 
#include <sys/mkdev.h> 
#endif 


int 
main(int argc, char *argv[]) 


{ 


ITE i$ 

struct stat buf; 

for (i = 1; i < argc; itt) { 
PLIntL (igs argv[i) z 


if (stat(argv[i], &buf) < 0) { 
err ret("stat error"); 


continue; 
} 
printf ("dev = $d/$d", major(buf.st dev), minor(buf.st dev)); 
if (S ISCHR(buf.st mode) || S ISBLK(buf.st mode)) { 


printf(" ($s) rdev - $d/$d", 


(S ISCHR(buf.st mode)) ? "character" : "block", 
major(buf.st rdev), minor(buf.st rdev)); 
} 
printf("Nn"t)s 
} 
exit (0); 


图 4-25 打印 st_dev 和 st_rdev 值 


在 Linux 上 运行 此 程序 得 到 下 面 的 输出 : 

$ ./a.out / /home/sar /dev/tty[01] 

/: dev = 8/3 

/home/sar: dev = 8/4 

/dev/ttyO: dev = 0/5 (character) rdev = 4/0 

/dev/tty1: dev = 0/5 (character) rdev = 4/1 

$ mount 哪些 目录 安装 在 哪些 设 
备 上 ? 

/dev/sda3 on / type ext3 (rw,errors=remount-ro,commit=0) 

/dev/sda4 on /home type ext2 (rw,commit-0) 

$ Is -l1 /dev/tty[01] /dev/sda[34] 

brw-rw---- 1 root 8, 3 2011-07-01 11:08 /dev/sda3 

brw-rw---- 1 root 8, 4 2011-07-01 11:08 /dev/sda4 

Crw--w---- 1 root 4, 0 2011-07-01 11:08 /dev/ttyO 

CIW------- 1 root 4, 1 2011-07-01 11:08 /dev/tty1 

传 给 该 程序 的 前 两 个 参数 是 目录 (/ 和 /home/sar) ， 后 两 个 参数 是 
设备 名 /dev/tty[01] 。 (我 们 用 shell 正则 表达 式 语言 以 缩短 所 需 的 输入 
量 。shell 将 字符 串 /dev/tty[01] 扩 展 为 /dev/tty0 /dev/tty1 ° ) 

我 们 期 望 设备 是 字符 特殊 文件 。 从 程序 的 输出 可 见 ， 根 目录 
和 /home/sar 目录 的 设备 号 不 同 ， 这 表示 它们 位 于 不 同 的 文件 系统 中 。 
运行 mount(1) 命 令 可 以 证 明了 这 一 点 。 


‘Ja Allstar? £78 Amounts A T es En ALT fa Bk Vc f A PS A hin c 
备 。 这 两 个 磁盘 设备 是 块 特殊 文件 ， 而 两 个 终端 设备 是 字符 特殊 文 
件 。 (通常 ， 只 有 那些 包含 随机 访问 文件 系统 的 设备 类 型 是 块 特殊 文 
件 设 备 ， 如 人 硬盘 驱动 如 、 软 副 驱 动 磊 和 CD-ROM 等 。UNIX 的 早期 版 本 
支持 磁带 存放 文件 系统 ， 但 这 从 未 广泛 使 用 过 。) 

注意 ， 两 个 终端 设备 (st_dev) 的 文件 名 和 i 节点 在 设备 0/5 上 
(devtmpfs 伪 文件 系统 ， 它 实现 了 /dev 文 件 系统 ) ， 但 是 它们 的 实际 设 
备 号 是 4/0 和 4/1。 


4.25 文件 访问 权限 位 小 结 


我 们 已 经 说 明了 所 有 文件 访问 权限 位 ， 其 中 某 些 位 有 多 种 用 途 。 
图 4-26 列 出 了 所 有 这 些 权 限 位 ， 以 及 它们 对 普通 文件 和 目录 文件 的 作 
用 o 

最 后 9 个 常量 还 可 以 分 成 如 下 3 组 : 

S IRWXU = S IRUSR | S IWUSR | S IXUSR 

S IRWXG - S IRGRP | S IWGRP | S IXGRP 

S IRWXO - S IROTH | S IWOTH | S IXOTH 


常量 说 明 对 普通 文件 的 影响 对 目录 的 影响 


S_ISUID 设置 用 户 ID | 执行 时 设置 有 效用 户 ID (未 使 用 ) 
S ISGID 设置 组 ID 若 组 执行 位 设置 ， 则 执行 时 设置 有 效 将 在 目录 中 创建 的 新 文件 的 组 ID 
组 ID; 否则 使 强制 性 锁 起 作用 ( 若 支 持 ) | 设置 为 目录 的 组 ID 


S_ISVTX 粘着 位 在 交换 区 缓存 程序 正文 ( 若 支 持 ) 限 止 在 目录 中 删除 和 重 命名 文件 
S IRUSR 许可 用 户 读 文件 许可 用 户 读 目录 项 
S IWUSR 许可 用 户 写 文件 许可 用 户 在 目录 中 删除 和 创建 文件 


S_IXUSR 许可 用 户 执 行文 件 许可 用 户 在 目录 中 搜索 给 定 路 径 名 
S_IRGRP 许可 组 读 文 件 许可 组 读 目录 项 

S IWGRP 许可 组 写 文件 许可 组 在 目录 中 删除 和 创建 文件 
S_IXGRP 许可 组 执行 文件 许可 组 在 目录 中 搜索 给 定 路 径 名 
S IROTH 其 他 读 许可 其 他 读 文 件 许可 其 他 读 目录 项 

S_IWOTH 其 他 写 许可 其 他 写 文件 许可 其 他 在 目录 中 删除 和 创建 文件 
S_IXOTH 其 他 执行 许可 其 他 执行 文件 许可 其 他 在 目录 中 搜索 给 定 路 径 名 


图 4-26 文件 访问 权限 位 小 结 


4.26 小 结 


本 章 内 容 围 绕 stat 函 数 ， 详 细 介 绍 了 stat 结 构 中 的 每 一 个 成 员 。 这 使 
我 们 对 UNIX 文 件 和 目录 的 各 个 属性 都 有 所 了 解 。 我 们 讨论 了 文件 和 目 
录 在 文件 系统 中 是 如 何 设 计 的 以 及 如 何 使 用 文件 系统 命名 空间 。 对 文 
件 和 目录 的 所 有 属性 以 及 对 文件 和 目录 进行 操作 的 所 有 函数 的 全 面 了 
解 ， 对 于 UNIX 编 程 是 非常 重要 的 。 


习题 


4.1 用 stat 函 数 替 换 图 4-3 程 序 中 的 lstat 函 数 ， 如 若 命 令 行 参数 之 一 
ett SHER, 会 及 生 什么 变化 ? 
4.2 如 果 文 件 模式 创建 屏蔽 字 是 777 (八进制 ) ， 结 果 会 怎样 ? 用 


shell 的 umask 命 令 验 证 该 结果 。 


4.3 天 闭 一 个 你 所 拥有 文件 的 用 户 读 权限 ， 将 导致 拒绝 你 访问 目 己 
的 文件 ， 对 此 进行 验证 。 

4.4 创建 文件 foo 和 和 bar 后， 运行 图 4-9 的 程序 ， 将 发 生 什么 情况 ? 

4.5 4.12 市 中 讲 到 一 个 普通 文件 的 大 小 可 以 为 0， 同 时 我 们 又 知道 
st_size 字 段 是 为 目录 或 符号 链接 定义 的 ， 那 么 目录 和 符号 链接 的 长 度 是 
否 可 以 为 0? 

4.6 编写 一 个 类 似 cp(1) 的 程序 ， 它 复制 包含 空洞 的 文件 ， 但 不 将 字 
玉 0 写 到 输出 文件 中 去 。 

4.7 在 4.12 节 ]s 命 令 的 输出 中 ，core 和 core.copy 的 访问 权限 不 同 ， 如 
果 创 建 两 个 文件 时 umask 没 有 变 ， 说 明 为 什么 会 发 生 这 种 差别 。 

4.8 在 运行 图 4-16 的 程序 时 ， 使 用 了 AORERE T DSL BT FG Zi 
空间 。 为 什么 不 使 用 du(1) 命 令 ? 

4.9 图 4-20 中 显示 unlink 函 数 会 修改 文件 状态 更 改 时 间 ， 这 是 怎样 
发 生 的 ? 

4.10 4.227, ABT AFT POC FEA BR rel BT my ftw EK aS PE FP 
么 影响 ? 

4.11 在 4.22 广 中 的 myftw 从 不 改变 其 目录 ， 对 这 种 处 理 方法 进行 改 
动 : 每 次 过 到 一 个 目录 就 用 其 调用 chdir， 这 样 每 次 调用 lstat 时 束 可 以 使 
用 文件 名 而 非 路 径 名 ， 处 理 完 所 有 的 目录 项 后 执行 chdir("..")。 比 较 这 
种 版 本 的 程序 和 书 中 程序 的 运行 时 间 。 

4.12 每 个 进程 都 有 一 个 根 目 录用 于 解析 绝对 路 径 名 ， 可 以 通过 
chroot 函数 改变 根 目 未 。 在 手册 中 和 碍 阅 此 函数 。 说 明 这 个 函数 什么 时 候 
有 用 。 

4.13 如 何 只 设置 两 个 时 间 值 中 的 一 个 来 使 用 utimes 函 数 ? 

4.14 有 些 版 本 的 finger(1) 命 令 输 出 “New mail received ...” F0 “unread 
since ...”， 其 中 ... 表 示 相 应 的 日 斯 和 时 间 。 程 序 是 如 何 决定 这 些 日 斯 和 
时 间 的 ? 


4.15 用 cpio(1) 和 tar(1) 命 令 检 查 档案 文件 的 格式 〈 请 参阅 《UNIX 程 
序 员 手册 》 第 5 部 分 中 的 说 明 ) 。3 个 可 能 的 时 间 值 中 哪 几 个 是 为 每 一 
个 文件 保存 的 ? 你 认为 文件 复原 时 ， 文 件 的 访问 时 间 是 什么 ? 为 什 
ZA? 

4.16 UNIX 系 统 对 目录 树 的 深度 有 限制 吗 ? 编写 一 个 程序 循环 ， 在 
每 次 循环 中 ， 创 建 目录 ， 并 将 该 目录 更 改 为 工作 目录 。 确 保 叶 厄 反 的 
绝对 路 径 名 的 长 度 大 于 系统 的 PATH, MAX 限制 。 可 以 调用 getcwd 得 到 
目录 的 路 径 名 吗 ? 标准 UNIX 系 统 工具 是 如 何 处 理 长 路 径 名 的 ? 对 目录 
可 以 使 用 tar 或 cpio 命 令 归 档 吗 ? 

4.17 3.16 节 中 描述 了 /dev/fd 特征 。 如 果 每 个 用 户 都 可 以 访问 这 些 
文件 ， 则 其 访问 权限 必须 为 rw-rw-rw-。 有 些 程序 创建 输出 文件 时 ， 先 
删除 该 文件 以 确保 该 文件 名 不 存在 ， 忽 略 返回 码 。 

unlink (path); 

if ( (fd = creat(path, FILE MODE)) < 0) 

err Sys(...); 
如 果 path 是 /dev/fd/1， 会 出 现 什 么 情况 ? 


本 章 讲 述 标准 MO 库 。 不 仅 是 UNIX， 很 多 其 他 操作 系统 都 实现 了 标 
准 IO 库 ， 所 以 这 个 库 由 ISO C 标 准 说 明 。Single UNIX Specification 对 
ISO C 标 准 进 行 了 扩充 ， 定义 了 男 外 一 些 接 口 。 

标准 1O 库 处 理 很 多 细节 ， 如 缓冲 区 分 配 、 以 优化 的 块 长 度 执行 VO 
等 。 这 些 处 理 使 用 户 不 必 担 心 如 何 选 择 使 用 正确 的 块 长 度 〈 如 3.9 节 中 
所 述 ) 。 这 使 得 它 便于 用 户 使 用 ， 但 是 如 果 我 们 不 深入 地 了 解 IO 库 画 
数 的 操作 ， 也 会 带 来 一 些 问 题 。 

标准 IJO 库 是 由 Dennis Ritchie 在 1975 年 左右 编写 的 。 它 是 Mike Lesk 
编写 的 可 移植 JO 库 的 主要 修改 版 本 。 令 人 惊讶 的 是 ，35 年 来 ， 几 乎 没 
有 对 标准 MO 库 进 行 修 改 。 


5.2 } FILE» 


在 第 3 章 中 ， 所 有 IO 函数 都 是 围绕 文件 描述 符 的 。 当 打开 一 个 文件 
时 ， 即 返回 一 个 文件 描述 符 ， 然 后 该 文件 描述 符 就 用 于 后 续 的 VO 操 
作 。 而 对 于 标准 IO 库 ， 它 们 的 操作 是 围绕 流 (stream) 进行 的 〈 请 乡 
将 标准 MO 术语 流 与 System V 的 STREAMS IO 系统 相 混淆 ，STREAMS 


IO 系统 是 System V 的 组 成 部 分 ，Single UNIX Specification 则 将 其 标准 
化 为 XSI STREAMS 选 项 ， 但 是 在 SUSv4 中 已 经 将 其 标记 为 弃 用 ) ° 4 
用 标准 VO 库 打开 或 创建 一 个 文件 时 ， 我 们 已 使 一 个 流 与 一 个 文件 相关 
联 。 
对 于 ASCII 字 符 集 ， 一 个 字符 用 一 个 字 记 表示 。 对 于 国际 字符 集 ， 

一 个 字符 可 用 多 个 字 下 表示 。 标 准 IJO 文 件 流 可 用 于 单字 节 或 多 字 站 

(C) 字符 集 。 流 的 定向 (stream's orientation) 决定 了 所 读 、 写 的 字 
符 是 单字 世 还 是 多 字 节 的 。 当 一 个 流 最 初 被 创建 时 ， 它 并 没有 定向 。 
如 若 在 未 定向 的 流 上 使 用 一 个 多 字 市 VO 函数 ( 见 <wchar.h>) ， 则 将 
VALE) XE [8] x EJ S XE [SIR ^ a FE ARE IL HJ D Lf Fd — FS OK 
数 ， 则 将 该 流 的 定 同 设 为 字 节 定 同 的 。 只 有 两 个 贸 数 可 改变 流 的 定 
[t] ° freopenER Zi 〈 稍 后 讨论 ) 清除 一 个 流 的 定向 ;fwide 函 数 可 用 于 设 
ELLA xe [A] 9 


#include <stdio.h> 


#include <wchar.h> 

int fwide(FILE *fp, int mode); 

返回 值 : Aew EA, REEE; AYES TERN, KEK 

值 ; 者 流 是 未 定 加 的， 返回 0 

根据 mode 参 数 的 不 同 值 ，fwide 函 数 执行 不 同 的 工作 。 

“如 大 mode 参 数值 为 员 ，fwide 将 试图 使 指定 的 流 是 字 节 定向 的 。 

“如 看 mode 参 数值 为 正 ，fwide 将 试图 使 指定 的 流 是 宽 定 回 的 。 

“如 若 mode 参 数值 为 0，fwide 将 不 试图 设置 流 的 定向 ， 但 返回 标识 
该 流 定 同 的 值 。 

注意 ，fwide 并 不 改变 已 定向 流 的 定向 。 还 应 注意 的 是 ，fwide 无 
出 钳 返 回 。 试 想 ， 如 奉 流 是 无 效 的， 那么 将 发 生 什 么 呢 ? 我 们 唯一 可 
依靠 的 是 ， 在 调用 fwide 前 先 清除 errmno， 从 fwide 返 回 时 检查 ermo 的 
值 。 在 本 书 的 其 余部 分 ， 我们 只 涉及 字 节 定向 流 。 


HI A— E, PRYEVORNBUfopen (2:55.55) 返回 一 个 指 问 
FILE 对 象 的 指针 。 该 对 象 通常 是 一 个 结构 ， 它 包含 了 标准 1/O 库 为 管理 
该 流 需 要 的 所 有 信息 ， 包 括 用 于 实际 VO 的 文件 描述 符 、 指 向 用 于 该 流 
缓冲 区 的 指针 、 绥 冲 区 的 长 度 、 当 前 在 缓冲 区 中 的 字符 数 以 及 出 错 标 
ee o 

应 用 程序 没有 必要 检验 FILE 对 象 。 为 了 引用 一 个 流 ， 需 将 FILE 指 
针 作 为 参数 传递 给 每 个 标准 VO 函数 。 在 本 书 中 ， 我 们 称 指向 FILE 对 和 象 
的 指针 (类 型 为 FILE*) 为 文件 指针 。 

在 本 章 中 ， 我 们 在 UNIX 系 统 环境 中 说 明 标 准 VO 库 。 正 如 前 述 ， 此 
标准 库 已 移植 到 UNIX 之 外 的 很 多 系统 中 。 但 是 为 了 说 明 该 库 实现 的 一 
些 细节 ， 我 们 将 讨论 其 在 UNIX 系 统 上 的 典型 实现 。 


对 一 个 进程 预定 义 了 3 个 流 ， 并 且 这 3 个 流 可 以 自动 地 被 进程 使 
用 ， 它 们 是 : 标准 输入 、 标 准 输出 和 标准 错误 。 这 些 流 引 用 的 文件 与 
在 3.22 节 中 提 到 文件 描述 符 STDIN_FILENO、STDOUT_FILENO 和 
STDERR_FILENO 所 引用 的 相同 。 

这 3 个 标准 WO 流通 过 预定 义 文件 指针 stdin、stdout 和 stderr 加 以 引 
用 。 这 3 个 文件 指针 定义 在 头 文件 <stdio.h> 中 。 


5.4 缓冲 


标准 IO 库 提 供 缓 冲 的 目的 是 尽 可 能 减少 使 用 read 和 write 调用 的 次 
数 〈 见 图 3-6， 其 中 显示 了 在 不 同 缓冲 区 长 度 情 况 下 ， 执 行 JO 所 需 的 


CPU 时 间 量 ) 。 它 也 对 每 个 IO 流 自 动 地 进行 缓冲 管理 ， 从 而 避免 了 应 
用 程序 需要 考虑 这 一 点 所 华 来 的 麻烦 。 遗 憾 的 是 ， 标 准 IJO 库 最 令 人 迷 
惑 的 也 是 它 的 缓冲 。 

标准 WO 提供 了 以 下 3 种 类 型 的 缓冲 。 

(1) 全 缓冲 。 在 这 种 情况 下 ， 在 填 满 标准 IO 缓冲 区 后 才 进 行 实际 
1/O 操 作 。 对 于 驻 留 在 磅 盘 上 的 文件 通常 是 由 标准 VO 库 实施 全 绥 冲 的 。 
在 一 个 流 上 执行 第 一 次 IO 操作 时 ， 相 关 标 准 IO 函 数 通常 调用 malloc 

( 见 7.8 节 ) 获得 需 使 用 的 缓冲 区 。 

术语 冲洗 (flush) 说 明 标 准 1O 绥 冲 区 的 写 操 作 。 缓 冲 区 可 由 标准 
IO 例 程 自 动 地 冲洗 (例如 ， 当 填 满 一 个 缓冲 区 时 ) ， 或 者 可 以 调用 画 
数 fflush 冲洗 一 个 流 。 值 得 注意 的 是 ， 在 UNIX 环 境 中 ，flush 有 两 种 意 
思 。 在 标准 WO 库 方面 ，flush (冲洗 ) 意味 着 将 缓冲 区 中 的 内 容 写 到 磁 
AE 〈 该 缓冲 区 可 能 只 是 部 分 填 满 的 ) 。 在 终端 驱动 程序 方面 ( 例 
如 ， 在 第 18 章 中 所 述 的 tcflush 函 数 ) ，flush 〈 刷 清 ) 表示 丢弃 已 存储 在 
缓冲 区 中 的 数据 。 

(2) 行 缓冲 。 在 这 种 情况 下 ， 当 在 输入 和 输出 中 遇 到 换行 符 时 , 
标准 WO 库 执行 VO 操 作 。 这 允许 我 们 一 次 输出 一 个 字符 AEREO K 
数 fputc) ， 但 只 有 在 写 了 一 行 之 后 才 进 行 实际 IO 操作 。 当 流 涉及 一 个 
终端 时 (如 标准 输入 和 标准 输出 ) ， 通 常 使 用 行 缓冲 。 

对 于 行 缓冲 有 两 个 限制 。 第 一 ， 因 为 标准 WO 库 用 来 收集 每 一 行 的 
缓冲 区 的 长 度 是 固定 的 ， 所 以 只 要 填 满 了 缓冲 区 ， 那 么 即使 还 没有 写 
一 个 换行 符 ， 也 进行 IO 操作 。 第 二 ， 任 何 时 候 只 要 通过 标准 IO FEX 
KM (a) 一 个 不 带 缓 冲 的 流 ， 或 者 (b) 一 个 行 缓冲 的 流 〈 它 从 内 核 
请 求 需要 数据 ) 得 到 输入 数据 ， 那 么 就 会 冲洗 所 有 行 缓冲 输出 流 。 在 

(b) 中 带 了 一 个 在 括号 中 的 说 明 ， 其 理由 是 ， 所 需 的 数据 可 能 已 在 该 
缓冲 区 中 ， 它 并 不 要 求 一 定 从 内 核 读 数据 。 很 明显 ， 从 一 个 不 谤 缓冲 
的 流 中 输入 (BE (a) 项 ) 需要 从 内 核 获 得 数据 。 


(3) 不 带 缓冲。 标准 1/O 库 不 对 字符 进行 缓冲 存储 。 例 如 ， 若 用 标 
准 WO 男 数 fputs 写 15 个 字符 到 不 带 缓冲 的 流 中 ， 我 们 就 期 望 这 15 个 字符 
能 立即 输出 ， 很 可 能 使 用 3.8 节 的 write 函数 将 这 些 字符 写 到 相关 联 的 打 
开 文 件 中 。 

标准 错误 流 stderr 通 常 是 不 带 缓 冲 的 ， 这 就 使 得 出 错 信息 可 以 尽快 
显示 出 来 ， 而 不 管 它们 是 否 含有 一 个 换行 符 。 

ISO C 要 求 下 列 缓冲 特征 。 

“ 当 且 仅 当 标准 输入 和 标准 输出 并 不 指向 交互 式 设 备 时 ， 它 们 才 是 
全 缓冲 的 。 

"标准 错误 决 不 会 是 全 缓冲 的 。 

但 是 ， 这 并 没有 告诉 我 们 如 果 标 准 输入 和 标准 输出 指向 交互 式 设 
备 时 ， 它 们 是 不 带 缓冲 的 还 是 行 缓冲 的 ; 以 及 标准 错误 是 不 带 缓冲 的 
还 是 行 缓冲 的 。 很 多 系统 默认 使 用 下 列 类 型 的 缓冲 : 

"标准 错误 是 不 带 缓冲 的 。 

"若是 指 同 终端 设备 的 流 ， 则 是 行 缓冲 的 ， 否 则 是 全 绥 冲 的 。 

本 书 讨论 的 4 种 平台 都 遵从 标准 MO 缓冲 的 这 些 惯 例 ， 标 准 错误 是 不 
带 缓冲 的 ， 打 开 至 终端 设备 的 流 是 行 缓冲 的 ， 其 他 流 是 全 缓冲 的 。 

我 们 将 在 5.12 节 和 图 5-1 对 标准 IO 缓冲 做 更 详细 的 说 明 。 

对 任何 一 个 给 定 的 流 ， 如 果 我 们 并 不 喜欢 这 些 系 统 默认 ， 则 可 调 
用 下 列 两 个 函数 中 的 一 个 更 改 缓冲 类 型 。 

#include <stdio.h> 


void setbuf(FILE *restrict fp, char *restrict buf); 


int setvbuf(FILE *restrict fp, char *restrict buf, int mode, size_t size); 
REE: ERJ, welo; Auta, eE 
这 些 函 数 一 定 要 在 流 已 被 打开 后 调用 (这 是 十 分 明显 的 ， 因 为 每 
个 函数 都 要 求 一 个 有 效 的 文件 指针 作为 它们 的 第 一 个 参数 ) ， 而 且 也 
应 在 对 该 流 执行 任何 一 个 其 他 操作 之 前 调用 。 


可 以 使 用 setbuf 函数 打开 或 关闭 缓冲 机 制 。 为 了 带 缓冲 进行 VO, 
参数 buf 必 须 指 向 一 个 长 度 为 BUFSIZ 的 缓冲 区 (该 常量 定义 在 <stdio.h> 
H) 。 通 常 在 此 之 后 该 流 就 是 全 缓冲 的 ， 但 是 如 果 该 流 与 一 个 终端 设 
备 相 关 ， 那 么 某 些 系统 也 可 将 其 设置 为 行 缓冲 的 。 为 了 关闭 缓冲 ， 将 
buf 设 置 为 NULL 。 

使 用 setvbuf， 我 们 可 以 精确 地 说 明 所 需 的 缓冲 类 型 。 这 是 用 mode 


参数 实现 的 : 
_IOFBF 全 缓冲 
_IOLBF 行 缓冲 
_IONBF 不 带 缓 冲 


如 采 指 定 一 个 不 市 缓冲 的 流 ， 则 忽略 buf 和 size 参 数 。 如 采 指 定 全 
缓冲 或 行 缓冲 ， 则 buf 和 size 可 选择 地 指定 一 个 缓冲 区 及 其 长 度 。 如果 
该 流 是 市 缓冲 的 ， 而 buf 是 NULL ， 则 标准 IO 库 将 目 动 地 为 该 流 分 配 适 
当 长 度 的 缓冲 区 。 适 当 长 度 指 的 古 由 常量 BUFSIZ 所 指定 的 值 。 

某 些 C 范 数 库 实 现 使 用 stat 结 构 中 的 成 员 st_blksize 所 指定 的 值 〈 见 


42:8) 决定 最 佳 WO 缓 冲 区 长 度 。 在 本 章 的 后 续 内 容 中 可 以 看 到 ，GNU 
C 芳 数 库 束 使 用 这 种 方法 。 
图 5-1 列 出 了 这 两 个 函数 的 动作 ， 以 及 它们 的 各 个 选项 。 


函数 mode buf 缓冲 区 及 长 度 缓冲 类 型 
非 空 KEX BUFSIZ 的 用 户 缓冲 区 buf 全 缓冲 或 行 缓冲 
u ay ay 
NULL (无 缓冲 区 ) 不 带 缓冲 
D ^. "y. o WIE JY n " 
非 空 KEX size 的 用 户 缓冲 区 buf 全 缓冲 


IOFBF = - 
E NULL 合适 长 度 的 系统 缓冲 区 buf 
setvbuf 长 度 为 size 的 用 户 缓冲 区 buf mum 
 IOLBF XII a= Sr 行 缓冲 
合适 长 度 的 系统 缓冲 区 buf 


(无 缓冲 区 ) 不 带 缓冲 
图 5-1 setbuf 和 setvbuf 函 数 

要 了 解 ， 如 果 在 一 个 函数 内 分 配 一 个 自动 变量 类 的 标准 VO 缓冲 
区 ， 则 从 该 函数 返回 之 前 ， 必 须 关 闭 该 流 (7.8 节 将 对 此 做 更 多 讨 


iE) 。 另 外 ， 其 些 实现 将 缓冲 区 的 一 部 分 用 于 存放 它 自 己 的 管理 操作 
信息 ， 所 以 可 以 存放 在 缓冲 区 中 的 实际 数据 字 市 数 少 于 size。 一 般 而 
， 应 由 系统 选择 缓冲 区 的 长 度 ， 并 自动 分 配 缓冲 区 。 在 这 种 情况 下 
天 闭 此 流 时 ， 标 准 WO 库 将 目 动 释放 缓冲 区 。 

任何 时 候 ， 我 们 都 可 强制 冲洗 一 个 流 。 

#include<stdio.h> 


int fflush(FILE *fp); 


iil 


REE: ARD, wE 者 出错 ， 返 回 EOF 
此 函数 使 该 流 所 有 未 写 的 数据 都 被 传送 至 内 核 。 作 为 一 种 特殊 情 
形 ， 如 寿 印 是 NULL， 则 此 函 数 将 导致 所 有 输出 流 家 冲洗 。 


5.5 [ 


下 列 3 个 函数 打开 一 个 标准 MO 流 。 
#include <stdio.h> 
FILE *fopen(const char *restrict pathname, const char *restrict type); 
FILE *freopen(const char *restrict pathname, const char *restrict type, 
FILE *restrict fp); 

FILE *fdopen(int fd, const char *type); 

3 个 函数 的 返回 值 : 者 成 功 ， 返 回 文件 指针 ;者 出 错 ， 返 回 NULL 
这 3 个 函数 的 区 别 如 下 。 

(1) fopen 范 数 打 开路 径 名 为 pathname 的 一 个 指定 的 文件 。 

(2) freopen 函数 在 一 个 指定 的 流 上 打开 一 个 指定 的 文件 ， 如 若 该 
流 已 经 打开 ， 则 先 关 闭 该 流 。 若 该 流 已 经 定 同 ， 则 使 用 freopen 清除 该 
定向 。 此 函数 一 般 用 于 将 一 个 指定 的 文件 打开 为 一 个 预定 义 的 流 : 标 
准 输入 、 标 准 输出 或 标准 错误 。 


(3) fdopen 函 数 取 一 个 已 有 的 文件 描述 符 〈 我 们 可 能 从 open、 
dup ` dup2 ^ fcntl ^ pipe ^ socket ` socketpairBX accept ER 23 3 E FL xc PETRI 
WIF) ， 并 使 一 个 标准 的 VO 流 与 该 描述 符 相 结合 。 此 函数 常用 于 由 创 
建 管道 和 网 络 通信 通道 范 数 返 回 的 描述 符 。 因 为 这 些 特殊 类 型 的 文件 
不 能 用 标准 IO 函数 fopen 打 开 ， 所 以 我 们 必须 先 调 用 设备 专用 函数 以 获 
得 一 个 文件 描述 符 ， 然 后 用 fdopen 使 一 个 标准 1O 流 与 该 描述 符 相 结 


de 


fopen 和 freopen 是 ISO CH Bir ei ab a » MISO C 并 不 涉及 文件 描述 
符 ， 所 以 仅 有 POSIX.1 具 有 fdopen ° 

type 参 数 指定 对 该 IO 流 的 读 、 写 方式 ，ISO C 规 定 type 参 数 可 以 有 
15 种 不 同 的 值 ， 如 图 5-2 所 示 。 


说 明 open(2) 标 志 


r 或 rb 为 读 而 打开 O RDONLY 
w BK wb 把 文件 截断 至 0 长 ， 或 为 写 而 创建 O WRONLY|O CREAT|O TRUNC 


a BK ab 追加 ;为 在 文件 尾 写 而 打开 ， 或 为 写 而 创建 O WRONLY|O CREAT|O APPEND 
x+ 或 上 +b BK rb+ 为 读 和 写 而 打开 O_RDWR 


w+ 或 wtb 或 wb+ 把 文件 截断 至 0 长 ， 或 为 读 和 写 而 打开 O RDWR|O CREAT|O TRUNC 
a4BX a+b 或 ab+ 为 在 文件 尾 读 和 写 而 打开 或 创建 O RDWR|O CREAT|O APPEND 


图 5-2 打开 标准 IO 流 的 type 参 数 

使 用 字符 b 作 为 type 的 一 部 分 ， 这 使 得 标准 IO 系统 可 以 区 分 文本 文 
件 和 二 进 制 文件 。 因 为 UNIX 内 核 并 不 对 这 两 种 文件 进行 区 分 ， 所 以 在 
UNIX 系 统 环境 下 指定 字符 pb 作为 type 的 一 部 分 实际 上 并 无 作用 。 

对 于 fdopen，type 参 数 的 意义 稍 有 区 别 。 因 为 该 描述 符 已 被 打开 ， 
所 以 fdopen 为 写 而 打开 并 不 截断 该 文件 。〈 例 如 ， 帮 该 描述 符 原 来 是 由 
open 函 数 创 建 的 ， 而 且 该 文件 已 经 存在 ， 则 其 O_TRUNC 标 志 将 决定 是 
否 截 断 该 文件 。fdopen 画 数 不 能 截断 它 为 写 而 打开 的 任 一 文件 。) 25 
外 ， 标 准 VO 追 加 写 方式 也 不 能 用 于 创建 该 文件 (因为 如 果 一 个 描述 符 
引用 一 个 文件 ， 则 该 文件 一 定 已 经 存在 ) 。 


当 用 追加 写 类 型 打开 一 个 文件 后 ， 每 次 写 都 将 数据 写 到 文件 的 当 
前 尾 端 处 。 如 果 有 多 个 进程 用 标准 WO 追加 写 方式 打开 同一 文件 ， 那 么 
来 目 每 个 进程 的 数据 都 将 正确 地 写 到 文件 中 。 

4.4BSD 以 前 的 伯克利 版 本 以 及 Kernighan 和 Ritchie[1988] 第 177 
页 上 所 示 的 简单 版 本 的 fopen 函数 并 不 能 正确 地 处 理 追 加 写 方式 。 这 些 
版 本 在 打开 流 时 ， 调 用 lseek 定 位 到 文件 尾 端 。 在 涉及 多 个 进程 时 ， 为 
了 正确 地 支持 追加 写 方 式 ， 该 文件 必须 用 O_APPEND 标 志 打 开 ， 我 们 
已 在 3.3 节 中 对 此 进行 了 讨论 。 在 每 次 写 前 ， 做 一 次 lseek 操 作 同 样 也 不 
能 正确 工作 (如 同 在 3.11 节 中 讨论 的 一 样 ) e 

当 以 读 和 写 类 型 打开 一 个 文件 时 (type 中 + 号 ) ， 具 有 下 列 限制 。 

如 果 中 间 没 有 fflush、fseek、fsetpos 或 rewind， 则 在 输出 的 后 面 不 
能 直接 跟随 输入 。 

* 如 果 中 间 没 有 fseek、fsetpos 或 rewind， 或 者 一 个 输入 操作 没有 到 
达 文 件 尾 端 ， 则 在 输入 操作 之 后 不 能 直接 跟随 输出 。 

对 应 于 图 5-2， 图 5-3 中 列 出 了 打开 一 个 流 的 6 种 不 同 的 方式 。 


文件 必须 已 存在 
放弃 文件 以 前 的 内 容 


流 可 以 读 
流 可 以 写 
流 只 可 在 尾 端 处 写 


图 5-3 打开 一 个 标准 1/O 流 的 6 种 不 同方 式 

注意 ， 在 指定 w 或 a 类 型 创建 一 个 新 文件 时 ， 我 们 无 法 说 明 该 文件 
的 访问 权限 位 (第 3 章 中 所 述 的 open 函 数 和 creat 函 数 则 能 做 到 这 一 
A) 。POSIX.1 要 求实 现 使 用 如 下 的 权限 位 集 来 创建 文件 : 

S_IRUSR | S_IWUSR | S_IRGRP | S_IWGRP | S_IROTH | S_IWOTH 

回忆 4.8 节 ， 我 们 可 以 通过 调整 umask 值 来 限制 这 些 权限 。 
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调用 fdlose 天 闭 一 个 打开 的 流 。 

#include <stdio.h> 

int fclose(FILE *fp); 

REE: ERD, RE 者 出 错 ， 返 回 EOF 

在 该 文件 被 天 闭 之 前 ， 冲 洗 缓冲 中 的 输出 数据 。 缓 冲 区 中 的 任何 
输入 数据 被 丢弃 。 如 果 标 准 WVO 库 已 经 为 该 流 自 动 分 配 了 一 个 缓冲 区 ， 
则 释放 此 缓冲 区 。 

当 一 个 进程 正常 终止 时 〈 直 接 调用 exit 函 数 ， 或 从 main 函 数 返 
回 ) ， 则 所 有 带 未 写 缓冲 数据 的 标准 IO 流 都 被 冲洗 ， 所 有 打开 的 标准 
IO 流 都 被 关 闭 。 
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一 旦 打开 了 流 ， 则 可 在 3 种 不 同类 型 的 非 格式 化 VO 中 进行 选择 ， 对 
其 进行 读 、 写 操作 。 

(1) 每 次 一 个 字符 的 /O。 一 次 读 或 写 一 个 字符 ， 如 果 流 是 带 缓冲 
的 ， 则 标准 WO 函数 处 理 所 有 绥 冲 。 

(2) 每 次 一 行 的 WO。 如果 想 要 一 次 读 或 写 一 行 ， 则 使 用 fgets 和 
fputs。 每 行 都 以 一 个 换行 符 终 止 。 当 调用 fgets 时 ， 应 说 明 能 处 理 的 最 
大 行 长 。5.7 节 将 说 明 这 两 个 函数 。 

(3) 直接 IO。fread 和 fwrite 函 数 文 持 这 种 类 型 的 HO。 每 次 VOPR 
作 读 或 写 某 种 数量 的 对 象 ， 而 每 个 对 象 具 有 指定 的 长 度 。 这 两 个 函数 
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直接 IO (direct I/O) 这 个 术语 来 自 ISO C 标 准 ， 有 时 也 被 称 为 : 二 
进 制 1O、 一 次 一 个 对 象 JO、 面向 记录 的 MO 或 面向 结构 的 MO。 不 要 把 
1h SF VE Al FreeBSD il Linux $ FF HY open 3X HY O_DIRECT hn ms YEA , 
它们 之 间 是 没有 关系 的 。 

(5.11 节 说 明了 格式 化 IO 画 数 ， 如 printf 和 scanf 。) 

1. 输入 函数 

以 下 3 个 函数 可 用 于 一 次 读 一 个 字符 。 

#include <stdio.h> 

int getc(FILE *fp); 

int fgetc(FILE *fp); 

int getchar(void); 

3 个 函数 的 返回 值 ， 奉 成 功 ， 返 回 下 一 个 字符 ; 邦 已 到 达 文 件 尾 端 或 出 
错 ， 返 回 EOF 
函数 getchar 等 同 于 getc(stdin)。 前 两 个 函数 的 区 别 是 ，getc 可 被 实现 
为 安 ， 而 fgetc 不 能 实现 为 宏 。 这 意味 着 以 下 几 点 。 
(1) getc 的 参数 不 应 当 是 具有 副作用 的 表达 式 ， 因 为 它 可 能 会 被 
计算 多 次 。 
(2) 因为 fgetc 一 定 是 个 函数 ， 所 以 可 以 得 到 其 地 址 。 这 就 允许 将 
fgetc 的 地 址 作为 一 个 参数 传送 给 另 一 个 图 数 。 
(3) 调用 fgetc 所 需 时 间 很 可 能 比 调 用 getc 要 长 ， 因 为 调用 函数 所 
需 的 时 间 通 常 长 于 调用 宏 。 

这 3 个 函数 在 返回 下 一 个 字符 时 ， 将 其 unsigned char 类 型 转换 为 int 
类 型 。 说 明 为 无 符号 的 理由 是 ， 如 果 最 高 位 为 1 也 不 会 使 返回 值 为 负 。 
EK AEA SB ee, PEAT DO Ae a BER FF BE 
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求 是 一 个 负 值 ， 其 值 经 党 是 -1。 这 就 意味 着 不 能 将 这 3 个 函数 的 返回 值 
存放 在 一 个 字符 变量 中 ， 以 后 还 要 将 这 些 画 数 的 返回 值 与 第 量 EOF 比 
较 。 

注意 ， 不 管 是 出 错 还 是 到 达 文 件 尾 端 ， 这 3 个 函数 都 返回 同样 的 
值 。 为 了 区 分 这 两 种 不 同 的 情况 ， 必 须 调 用 ferror 或 feof ° 

#include <stdio.h> 

int ferror(FILE *fp); 

int feof(FILE *fp); 

两 个 函数 返回 值 : 若 条 件 为 真 ， 返 回 非 0 (EO) ; 否则 ， 返 回 0 (BO 
void clearerr(FILE *fp); 
在 大 多 数 实现 中 ， 为 每 个 流 在 FILE 对 象 中 维护 了 两 个 标志 : 


UTRIUS; 
"文件 结束 标志 。 


调用 clearerr 可 以 清除 这 两 个 标志 。 

从 流 中 读 取 数据 以 后 ， 可 以 调用 ungetc 将 字符 再 压 送 回流 中 。 

#include <stdio.h> 

int ungetc(int c, FILE *fp); 

返回 值 : ERD, Rel; 看 出 错 ， 返 回 EOF 

压 送 回 到 流 中 的 字符 以 后 又 可 从 流 中 读 出 ， 但 读 出 字符 的 顺序 与 
压 送 回 的 顺序 相反 。 应 当 了 解 ， 虽 然 ISO C 人 允许 实现 文 持 任 何 次 数 的 回 
送 ， 但 是 它 要 求实 现 提 供 一 次 只 回 送 一 个 字符 。 我 们 不 能 期 望 一 次 能 
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回 送 的 字符 ， 不 一 定 必须 是 上 一 次 读 到 的 字符 。 不 能 回 送 EOF 。 
但 是 当 已 经 到 达 文 件 尾 问 时 ， 仍 可 以 回 送 一 个 字符 。 下 次 读 将 返回 该 
字符 ， 再 读 则 返回 EOF。 之 所 以 能 这 样 做 的 原因 是 ， 一 次 成 功 的 ungetc 
调用 会 清除 该 流 的 文件 结束 标志 。 


当 正 在 读 一 个 输入 流 ， 并 进行 某 种 形式 的 切 词 或 记号 切 分 操作 
时 ， 会 经 常用 到 回 送 字 符 操 作 。 有 时 需要 先 看 一 看 下 一 个 字符 ， 以 决 
定 如 何 处 理 当 前 字符 。 然 后 就 需要 方便 地 将 刚 查 看 的 字符 回 送 ， 以 便 
下 一 次 调用 getc 时 返回 该 字符 。 如 有 果 标 准 VO 库 不 提供 回 送 能 力 ， 就 需 
将 该 字符 存放 到 一 个 我 们 目 己 的 变量 中 ， 并 设置 一 个 标志 以 便 判 别 在 
下 一 次 需要 一 个 字符 时 是 调用 getc， 还 是 从 我 们 自己 的 变量 中 取 用 这 
TFRS 

用 ungetc 压 送 回 字 符 时 ， 并 没有 将 它们 写 到 底层 文件 中 或 设备 上 ， 
只 是 将 它们 写 回 标准 1/O 库 的 流 缓冲 区 中 。 

2. 输出 函数 

对 应 于 上 面 所 述 的 每 个 输入 函数 都 有 一 个 输出 函数 。 

#include <stdio.h> 

int putc(int c, FILE *fp); 

int fputc(int c, FILE *fp); 


int putchar(int c); 

3 个 函数 返回 值 : ERE), alle; Aoife, 3K[B|EOF 
与 输入 函数 一 样 ，putchar(c) 等 同 于 putc(c, stdout)，putc 可 被 实现 为 
而 fputc 不 能 实现 为 宏 。 
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5.7 每 次 一 行 VO 


下 面 两 个 函数 提供 每 次 输入 一 行 的 功能 。 

#include <stdio.h> 

char *fgets(char *restrict buf, int n, FILE *restrict fp); 
char *gets(char *buf); 


两 个 函数 返回 值 ， 若 成 功 ， 返 回 buf; 若 已 到 达 文 件 尾 端 或 出 错 ， 返 回 
NULL 

这 两 个 函数 都 指定 了 缓冲 区 的 地 址 ， 读 入 的 行将 送 入 其 中 。gets 从 
标准 输入 读 ， 而 fgets 则 从 指定 的 流 读 。 

对 于 fgets， 必 须 指 定 缓冲 的 长 度 n。 此 函数 一 直 读 到 下 一 个 换行 符 
为 止 ， 但 是 不 超过 mn_ 1 个 字符 ， 读 入 的 字符 被 送 入 缓冲 区 。 该 缓冲 区 以 
null 字 世 结尾。 如若 该 行 包 括 最 后 一 个 换行 符 的 字符 数 超过 n_ 1， 则 
fgets 只 返回 一 个 不 完整 的 行 ， 但是， 缓冲 区 总 是 以 null 字 节 结 尾 。 对 
fgets 的 下 一 次 调用 会 继续 读 该 行 。 

gets 是 一 个 不 推荐 使 用 的 函数 。 其 问题 是 调用 者 在 使 用 gets 时 不 
能 指定 缓冲 区 的 长 度 。 这 样 就 可 能 造成 缓冲 区 淤 出 (如 若 该 行 长 于 缓 
冲 区 长 度 ) ， 写 到 缓冲 区 之 后 的 存储 空间 中 ， 从 而 产生 不 可 预料 的 后 
果 。 这 种 缺陷 曾 被 利用 ， 造 成 1988 年 的 因特网 蠕虫 事件 。 有 关 说 明 请 
见 1989 年 6 月 的 Communications of the ACM (vol.32,no.6) ° gets 与 fgets 
的 另 一 个 区 别 是 ，gets 并 不 将 换行 符 存 入 缓冲 区 中 。 

这 两 个 函数 对 换行 符 处 理 方式 的 差别 与 UNIX 的 进展 有 关 。 在 V7 的 
手册 (1979) 中 就 说 明 : “为 了 同 后 兼容 ，gets 删 除 换行 符 ， 而 fgets 则 
保留 换行 符 。” 

虽然 ISO C 要 求 提供 gets ， 但 请 使 用 fgets， 而 不 要 使 用 gets。 事 实 
上 ， 在 SUSv4 中 ， gets 被 标记 为 弃 用 的 接口 ， 而 且 在 ISO C 标 准 的 最 新 
版 本 (ISO/IEC 9899:2011) 中 已 被 忽略 。 

fputs 和 puts 提 供 每 次 输出 一 行 的 功能 。 


#include <stdio.h> 


int fputs(const char *restrict str, FILE *restrict fp); 


int puts(const char *str); 


两 个 函数 返回 值 : 者 成 功 ， 返 回 非 负 值 ; 者 出 错 ， 返 回 EOF 
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止 符 null 不 写 出 。 注 意 ， 这 并 不 一 定 是 每 次 输出 一 行 ， 因 为 字符 串 不 需 
要 换行 符 作 为 最 后 一 个 非 nul 字 下 。 通 种 ， 在 null 字 下 之 前 是 一 个 换行 
符 ， 但 并 不 要 求 总 是 如 此 。 

puts 将 一 个 以 null 子 市 终止 的 字符 串 写 到 标准 输出 ， 终 止 符 不 写 
出 。 但 是 ，puts 随 后 又 将 一 个 换行 符 写 到 标准 输出 。 

puts 并 不 像 它 所 对 应 的 gets 那样 不 安全 。 但 是 我 们 还 是 应 避免 使 
用 它 ， 以 免 需要 记 住 它 在 最 后 是 否 添加 了 一 个 换行 符 。 如 果 总 是 使 用 
fgets 和 fputs, 那么 束 会 熟知 在 每 行 终止 处 我 们 必须 目 己 处 理 换行 符 。 


5.8 标准 LO 的 效 3 


使 用 前 面 所 述 的 范 数 ， 我 们 能 对 标准 WO 系统 的 效率 有 所 了 解 。 图 
5-4 程 序 类 似 于 图 3-4 程 序 ， 它 使 用 getc 和 putc 将 标准 输入 复制 到 标准 输 
出 。 这 两 个 例 程 可 以 实现 为 实 。 


main (void) 


{ 


int [S 
while ((c = getc(stdin)) != EOF) 
if (putc(c, stdout) == EOF) 


err_sys("output error"); 


if (ferror(stdin) ) 


err_sys("input error"); 


exit(0); 


图 5-4 用 getc 和 putc 将 标准 输入 复制 到 标准 输出 


可 以 用 fgetc 和 fputc 改 写 该 程序 ， 这 两 个 一 定 是 函数 ， 而 不 是 安 
(我 们 没有 给 出 对 源 代 码 更 改 的 细节 ) 。 
最 后 ， 我 们 还 编写 了 一 个 读 、 写 行 的 版 本 ， 见 图 5-5。 


#include "apue.h" 


int 
main (void) 
{ 
char buf [MAXLINE]; 


while (fgets(buf, MAXLINE, stdin) !- NULL) 
if (fputs(buf, stdout) -- EOF) 


err sys("output error"); 


if (ferror(stdin)) 
err sys("input error"); 


exit(0); 


图 5-5 用 fgets 和 fputs 将 标准 输入 复制 到 标准 输出 


注意 ， 在 图 5-4 程 序 和 图 5-5 程 序 中 ， 没 有 显 式 地 关闭 标准 IJO 流 。 
我 们 知道 exit 函 数 将 会 神 洗 任何 未 写 的 数据 ， 然 后 关闭 所 有 打开 的 流 
(我 们 将 在 8.5 节 讨论 这 一 点 ) 。 将 这 3 个 程序 的 时 间 与 图 3-6 中 的 时 间 
进行 比较 是 很 有 趣 的 。 图 5-6 中 显示 了 对 同一 文件 (98.5 MB, 30077 
行 ) 进行 操作 所 得 的 数据 。 


图 3-6 中 的 最 佳 时 间 
fgets. fputs 


getc. putc 


fgetc. fputc 
图 3-6 中 的 单字 节 时 间 


图 5-6 使 用 标准 MO 例 程 得 到 的 时 间 结 果 


a 


对 于 这 3 个 标准 WO 版 本 的 每 一 个 ， 其 用 户 CPU 时 间 都 大 于 图 3-6 中 
的 最 佳 read 版 本 ， 因 为 在 每 次 读 一 个 字符 的 标准 VO 版 本 中 有 一 个 要 执 
行 1 亿 次 的 循环 ， 而 在 每 次 读 一 行 的 版 本 中 有 一 个 要 执行 3 144 984 次 的 
循环 。 在 read 版 本 中 ， 其 循环 只 需 执行 25 224 次 (对 于 缓冲 区 长 度 为 4 
0965-5) 。 因 为 系统 CPU 时 间 几 乎 相同 ， 所 以 用 户 CPU 时 间 的 差别 以 

等 待 O 结 束 所 消耗 时 间 的 差别 造成 了 时 钟 时 间 的 差别 。 

系统 CPU 时 间 几 乎 相同 ， 原 因 是 因为 所 有 这 些 程序 对 内 核 提 出 的 
读 、 写 请 求 数 基本 相同 。 注 意 ， 使 用 标准 IO 例 程 的 一 个 优点 是 无 需 考 
虑 缓冲 及 最 佳 O 长 度 的 选择 。 在 使 用 fgets 时 需要 考虑 最 大 行 长 ， 但 是 
与 选择 最 佳 IO 长 度 比较 ， 这 要 方便 得 多 。 

图 5-6 的 最 后 一 列 是 每 个 main 函 数 的 文本 空间 字 节 数 (由 C 编 译 器 
产生 的 机 器 指令 ) 。 从 中 可 见 ， 使 用 getc 和 putc 的 版 本 与 使 用 fgetc 和 
fputc 的 版 本 在 文本 空间 长 度 方面 大 体 相 同 。 通 常 ，getc 和 putc 实 现 为 
宏 ， 但 在 GNU C 库 实现 中 ， 宏 简单 地 扩充 为 画 数 调用 。 

使 用 每 次 一 行 WO 版 本 的 速度 大 约 是 每 次 一 个 字符 版 本 速度 的 两 
倍 。 如 果 fgets 和 fputs 函 数 是 用 getc 和 putc 实 现 的 〈 人 参见 Kernighan 和 
Ritchie[1988] 的 7.7 节 ) ， 那 么 ， 可 以 预期 fgets 版 本 的 时 间 会 与 getc 版 本 
接近 。 实 际 上 ， 每 次 一 行 的 版 本 会 更 慢 一 些 ， 因 为 除了 现 已 存在 的 6 百 
万 次 函数 调用 外 还 需 另 外 增加 2 亿 次 函数 调用 。 而 在 本 测试 中 所 用 的 
每 次 一 行 函 数 是 用 memccpy(3) 实 现 的 。 通 常 ， 为 了 提高 效率 ， 
memccpy 范 数 用 汇编 语言 而 非 C 语 言 编 写 。 正 因为 如 此 ， 每 次 一 行 版 本 
才 会 有 较 高 的 速度 。 

这 些 时 间 数 字 的 最 后 一 个 有 趣 之 处 在 于 : fgetc 版 本 较 图 3-6 中 
BUFFSIZE =1 的 版 本 要 快 得 多 。 两 者 都 使 用 了 约 2 亿 次 的 函数 调用 ， 在 
用 户 CPU 时 间 方 面 ，fgetc 版 本 的 速度 大 约 是 后 者 的 16 倍 ， 而 在 时 钟 时 
间 方 面 几乎 是 39 倍 。 造 成 这 种 差别 的 原因 是 : 使 用 read 的 版 本 执行 了 2 
亿 次 函数 调用 ， 这 也 就 引起 2 亿 次 系统 调用 。 而 对 于 fgetc 版 本 ， 它 也 执 


行 2 亿 次 函数 调用 ， 但 是 这 只 引起 25 224 次 系统 调用 。 系 统 调用 与 普通 
的 函数 调用 相 比 需要 人 花费 更 多 的 时 间 。 

需要 声明 的 是 ， 这 些 时 间 结 果 只 在 某 些 系 统 上 才 有 效 。 这 种 时 间 
结果 依赖 于 很 多 实现 的 符 征 ， 而 这 种 特征 对 于 不 同 的 UNIX 系 统 可 能 是 
不 同 的 。 尽 管 如 此 ， 有 这 样 一 组 数据 ， 并 对 各 种 版 本 的 过 别 做 出 解 
释 ， 这 有 助 于 我 们 更 好 地 了 解 系统 。 在 本 下 及 3.9 市 中 我 们 了 解 到 的 基 
本 事实 是 ， 标 准 IJO 库 与 直接 调用 read 和 write 函数 相 比 并 不 慢 很 多 。 对 
于 大 多 数 比 较 复 杂 的 应 用 程序 ， 最 主要 的 用 户 CPU 时 间 是 由 应 用 本 身 
的 各 种 处 理 消 耗 的 ， 而 不 是 由 标准 MO 例 程 消耗 的 。 


5.9 二 进 制 7O 


5.6 节 和 5.7 市 中 的 芳 数 以 一 次 一 个 字符 或 一 次 一 行 的 方式 进行 操 
作 。 如 果 进 行 二 进 制 VO 操作 ， 那 么 我 们 更 愿意 一 次 读 或 写 一 个 完整 的 
结构 。 如 宋 使 用 getc 或 putc 读 、 写 一 个 结构 ， 那 么 必须 循环 通过 整个 结 
构 ， 每 次 循环 处 理 一 个 字 玉 ， 一 次 读 或 写 一 个 字 节 ， 这 会 非 营 麻烦 而 
且 费 时 。 如 果 使 用 fputs 和 fgets， 那 么 因为 fputs 在 遇 到 nul 字 下 时 束 停 
止 ， 而 在 结构 中 可 能 含有 nul 字 闻 ， 所 以 不 能 使 用 它 实 现 读 结构 的 要 
求 。 相 类 似 ， 如 果 输 入 数据 中 包含 有 null 字 市 或 换行 符 ， 则 fgets 也 不 能 
正确 工作 。 因 此 ， 提 供 了 下 列 两 个 函数 以 执行 二 进 制 O 操 作 。 


include <stdio.h> 


size t fread(void *restrict ptr, size t size, size t nobj, FILE *restrict 
fp); 

size_t fwrite(const void *restrict ptr, size_t size, size_t nobj, FILE 
*restrict fp); 


两 个 函数 的 返回 值 : 读 或 写 的 对 象 数 
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(1) 读 或 写 一 个 二 进 制 数组 。 例 如 ， 为 了 将 一 个 浮 点 数组 的 第 2 
5 个 元 素 写 至 一 文件 上 ， 可 以 编写 如 下 程序 ; 

float data[10]; 

if (fwrite(&data[2], sizeof(float), 4, fp) != 4) 
err sys("fwrite error"); 

其 中 ， 指 定 size 为 每 个 数组 元 素 的 长 度 ，nobj 为 欲 写 的 元 素 个 数 。 
(2) 读 或 写 一 个 结构 。 例 如 ， 可 以 编写 如 下 程序 : 


struct { 


Short count; 


long total; 
char name[NAMESIZE]; 
} item; 


if (fwrite(&item, sizeof(item), 1, fp) != 1) 
err sys("fwrite error"); 

其 中 ， 指 定 size 为 结构 的 长 度 ，nobj 为 1 (要 写 的 对 象 个 数 ) 。 

将 这 两 个 例子 结合 起 来 殉 可 读 或 写 一 个 结构 数组 。 为 了 做 到 这 一 
点 ，size 应 当 是 该 结构 的 sizeof，nobj 应 是 该 数组 中 的 元 素 个 数 。 

fread 和 fwrite 返 回 读 或 写 的 对 象 数 。 对 于 读 ， 如 采 出 错 或 到 达 文 件 
尾 端 ， 则 此 数字 可 以 少 于 nobj。 在 这 种 情况 ， 应 调用 ferror 或 feof 以 判断 
究竟 是 那 一 种 情况 。 对 于 写 ， 如 果 返 回 值 少 于 所 要 求 的 nobj， 则 出 错 。 

使 用 二 进 制 1O 的 基本 问题 是 ， 它 只 能 用 于 读 在 同一 系统 上 已 写 的 
数据 。 多 年 之 前 ， 这 并 无 问题 〈 那 时 ， 所 有 UNIX 系 统 都 运行 于 PDP-11 
上 ) ， 而 现在 ， 很 多 异 构 系 统 通过 网 络 相互 连接 起 来 ， 而 且 ， 这 种 情 
况 已 经 非常 普遍 。 常 常 有 这 种 情形 ， 在 一 个 系统 上 写 的 数据 ， 要 在 男 
一 个 系统 上 进行 处 理 。 在 这 种 环境 下 ， 这 两 个 函数 可 能 就 不 能 正常 工 
作 ， 其 原因 是 : 


(1) 在 一 个 结构 中 ， 同 一 成 员 的 偏 移 量 可 能 随 编 译 程序 和 系统 的 
不 同 而 不 同 《由 于 不 同 的 对 齐 要 求 ) 。 确 实 ， 某 些 编译 程序 有 一 个 选 
项 ， 选 择 它 的 不 同 值 ， 或 者 使 结构 中 的 各 成 员 紧 密 包 装 〈 这 可 以 和 省 
存储 空间 ， 而 运行 性 能 则 可 能 有 所 下 降 ) ; 或 者 准确 对 齐 (以 便 在 运 
行 时 易于 存 取 结 构 中 的 各 成 员 ) 。 这 意味 着 即使 在 同一 个 系统 上 ， 一 
个 结构 的 二 进 制 存放 方式 也 可 能 因 编 译 程序 选项 的 不 同 而 不 同 。 

(2) 用 来 存储 多 字 市 整数 和 浮 点 值 的 二 进 制 格式 在 不 同 的 系统 结 
构 间 也 可 能 不 同 。 

在 第 16 章 讨 论 套 接 字 时 ， 我 们 将 涉及 某 些 相关 问题 。 在 不 同系 统 
之 间 交 换 二 进 制 数据 的 实际 解决 方法 是 使 用 互 认 的 规范 格式 。 关 于 网 
络 协 议 使 用 的 交换 二 进 制 数据 的 某 些 技术 ， 请 参阅 Rogo[1993] 的 8.2 市 
BY Æ Stevens ` FennerfllRudoff[2004]H5.18 71) ° 

在 8.14 广 中 ， 我 们 将 再 回 到 fread 函数 ， 那 时 将 用 它 读 一 个 二 进 制 
UNIX 的 进程 会 计 记 录 。 


结构 


5.10 定位 流 


有 3 种 方法 定位 标准 1O 流 。 

(1) ftell 和 fseek 范 数 。 这 两 个 范 数 自 V7 以 来 就 存在 了 ， 但 是 它 
们 都 假定 文件 的 位 置 可 以 存放 在 一 个 长 整 型 中 。 

(2) ftello Fil fseeko EH 2X ° Single UNIX Specification 引 入 了 这 两 个 
男 数 ， 使 文件 偏 移 量 可 以 不 必 一 定 使 用 长 整 型 。 它 们 使 用 off_t 数 据 类 
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(3) fgetpos 和 fsetpos 函 数 。 这 两 个 函数 是 由 ISO C 引 入 的 。 它 们 使 
用 一 个 抽象 数据 类 型 fpos_t 记 录 文 件 的 位 置 。 这 种 数据 类 型 可 以 根据 需 
要 定义 为 一 个 足够 大 的 数 ， 用 以 记 杂 文件 位 置 。 


需要 移植 到 非 UNIX 系 统 上 运行 的 应 用 程序 应 当 使 用 fgetpos 和 
fsetpos ° 

#include <stdio.h> 

long ftell(FILE *fp); 

返回 值 : BA, RASH Bian, 者 出 错 ， 返 回 -1L 
int fseek(FILE *fp, long offset, int whence); 
返回 值 : ERI, welo; AES, e- 
void rewind(FILE *fp); 

对 于 一 个 二 进 制 文件 ， 其 文件 位 置 指示 器 是 从 文件 起 始 位 置 开始 
度量 ， 并 以 字 节 为 度量 单位 的 。ftell 用 于 二 进 制 文件 时 ， 其 返回 值 就 是 
这 种 字 节 位 置 。 为 了 用 fseek 定 位 一 个 二 进 制 文件 ， 必 须 指定 一 个 字 节 
offset， 以 及 解释 这 种 偏 移 量 的 方式 。whence 的 值 与 3.6 广 中 ]seek 函 数 的 
相同 : SEEK_SET 表 示 从 文件 的 起 始 位 置 开 始 ，SEEK_CUR 表 示 从 当前 
文件 位 置 开 始 ，SEEK_END 表 示 从 文件 的 尾 端 开 始 。ISO C 并 不 要 求 一 
个 实现 对 二 进 制 文件 支持 SEEK_END 规 格 说 明 ， 其 原因 是 某 些 系统 
求 二 进 制 文件 的 长 度 是 某 个 幻 数 的 整数 倍 ， 结 尾 非 实际 内 容 部 分 则 填 
充 为 0。 但 是 在 UNIX 中 ， 对 于 二 进 制 文件 ， 则 是 文 择 SEEK_END 的 。 

对 于 文本 文件 ， 它 们 的 文件 当前 位 置 可 能 不 以 和 商 单 的 字 世 俩 移 量 
来 度量 。 这 主要 也 是 在 非 UNIX 系 统 中 ， 它 们 可 能 以 不 同 的 格式 存放 文 
本 文件 。 为 了 定位 一 个 文本 文件 ，whence 一 定 要 是 SEEK_SET， 而 且 
offset 只 能 有 两 种 值 : 0 (后退 到 文件 的 起 始 位 置 ) ， 或 是 对 该 文件 的 
ftell 所 返回 的 值 。 使 用 rewind 函 数 也 可 将 一 个 流 设 置 到 文件 的 起 始 位 
INE 

除了 偏 移 量 的 类 型 是 off_t 而 非 1ong 以 外 ，ftello 函 数 与 ftell 相 同 ， 
fseeko «255 fseek TH [A] 。 

#include <stdio.h> 


off_t ftello(FILE *fp); 


返回 值 : AA, RES ROCHE; Aoife, Eloff t)-1 
int fseeko(FILE *fp, off_t offset, int whence); 
返回 值 : AH, allo; AES, we- 
回忆 3.6 世 中 对 off_t 数 据 类 型 的 讨论 。 实 现 可 将 off t 类 型 定义 为 长 
于 32 位 。 
正如 我 们 已 提 及 的 ，fgetpos 和 fsetpos 两 个 函数 是 ISO C 标 准 引 入 
的 。 
#include <stdio.h> 


int fgetpos(FILE *restrict fp, fpos_t *restrict pos); 


int fsetpos(FILE *fp, const fpos t *pos); 
PIATEREDRIMB: Rt, allo; Sidi. eE 
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后 调用 fsetpos 时 ， 可 以 使 用 此 值 将 流 重 新 定位 至 该 位 置 。 


5.11 格式 化 VO 


1. 格式 化 输出 
格式 化 输出 是 由 5 个 printf 范 数 来 处 理 的 。 
#include <stdio.h> 
int printf(const char *restrict format, ...); 
int fprintf(FILE *restrict fp, const char *restrict format, ...); 
int dprintf(int fd, const char *restrict format, ...); 
3 个 函数 返回 值 : ARD, Dee, 大 输出 出 错 ， 返 回 负 什 
int sprintf(char *restrict buf, const char *restrict format，.…); 
返回 值 : 者 成 功 ， 返 回 存 入 数组 的 字符 数 ; 者 编码 出 错 ， 返 回 负 值 


int snprintf(char *restrict buf, size t n, const char *restrict format, ...); 


返回 值 : EPA EWA, IRA REAR, GRAS h 
错 ， 返 回 负 值 

printf 将 格式 化 数据 写 到 标准 输出 ，fprintf 写 至 指定 的 流 ，dprintf 写 
至 指定 的 文件 描述 符 ，sprintf 将 格式 化 的 字符 送 入 数组 buf 中 。sprintf 
在 该 数组 的 尾 端 目 动 加 一 个 null 宇和 ， 但 该 字符 不 包括 在 返回 值 中 。 

注意 ，sprintf 函 数 可 能 会 造成 由 buf 指 向 的 缓冲 区 的 溢出 。 调 用 者 
有 责任 确保 该 缓冲 区 足够 大 。 因 为 缓冲 区 次 出 会 造成 程序 不 稳定 甚至 
安全 隐患 ， 为 了 解决 这 种 缓冲 区 洲 出 问题 ， 引 入 了 snprintf 画 数 。 在 该 
函数 中 ， 缓 冲 区 长 度 是 一 个 显 式 参数 ， 超 过 缓冲 区 尾 端 写 的 所 有 字符 
都 被 丢弃 。 如 果 缓 冲 区 足够 大 ，snprintf 范 数 就 会 返回 写 入 缓冲 区 的 字 
符 数 。 与 sprintf 相 同 ， 该 返回 值 不 包括 结尾 的 null 字 方 。 若 snprintf 芳 数 
返回 小 于 缓冲 区 长 度 n 的 正 值 ， 那 么 没有 截断 输出 。 若 发 生 了 一 个 编码 
的 错误 ，snprintf 返 回 负 值 。 

虽然 dprintf 不 处 理 文件 指针 ， 但 我 们 仍然 把 它 包括 在 处 理 格式 化 
输出 的 函数 中 。 注 意 ， 使 用 dprintf 不 需要 调用 fdopen 将 文件 描述 符 转换 
为 文件 指针 (fprintf 需 要 ) 。 

格式 说 明 控 制 其 余 参 数 如 何 编 写 ， 以 后 义 如 何 显示 。 每 个 参数 按 
照 转换 说 明 编 写 ， 转 换 说 明 以 百 分 号 % 开 始 ， 除 转换 说 明 外 ， 格 式 字符 
串 中 的 其 他 字符 将 按 原样 ， 不 经 任何 修改 被 复制 输出 。 一 个 转换 说 明 
有 4 个 可 选择 的 部 分 ， 下 面 将 它们 都 示 于 方 括号 中 : 

%[flags][fldwidth][precision][lenmodifier]convtype 

图 5-7 总 结 了 各 种 标志 。 


HBS) 将 整数 按 千 位 分 组 字符 
在 字段 内 左 对 齐 输出 


总 是 显示 带 符 号 转换 的 正 负 号 

如 果 第 一 个 字符 不 是 正 负 号 ， 则 在 其 前 面 加 上 一 个 空格 
指定 另 一 种 转换 形式 〈 例 如 ， 对 于 十 六 进 制 格式 ， 加 Ox 前 级 ) 
添加 前 导 0《〈 而 非 空格 ) 进行 填充 


图 5-7 转换 说 明 中 的 标志 部 分 

fldwidth 说 明 最 小 字段 宽度 。 转 换 后 参数 字符 数 若 小 于 宽度 ， 则 多 
余 字 符 位 置 用 空格 填充 。 字 段 宽度 是 一 个 非 负 十 进 制 数 ， 或 是 一 个 星 
te) ® 

precision 说 明 整 型 转换 后 最 少 输出 数字 位 数 、 浮 点 数 转换 后 小 数 
点 后 的 最 少 位 数 、 字 符 串 转换 后 最 大 字 节 数 。 精 度 是 一 个 点 (.) ， 其 
后 跟随 一 个 可 选 的 非 负 十 进 制 数 或 一 个 星 号 (*) 。 

宽度 和 精度 字段 两 者 丝 可 为 *。 此 时 ， 一 个 整 型 参数 指定 宽度 或 精 
度 的 值 。 该 整 型 参数 正好 位 于 被 转换 的 参数 之 前 。 

lenmodifier 说 明 参 数 长 度 。 其 可 能 的 值 示 于 图 5-8 中 。 


将 相应 的 参数 按 signed 或 unsigned char 类 型 输出 
将 相应 的 参数 按 signed 或 unsigned short 类 型 输出 
将 相应 的 参数 按 signed M unsigned long 或 宽 字 符 类 型 输出 


将 相应 的 参数 按 signed 或 unsigned long long 类 型 输出 


intmax 七 或 uintmax t 


size t 
ptrdaff £ 
long double 


图 5-8 转换 说 明 中 的 长 度 修 饰 符 


conytype z& A 6H e "E fel A ERA AC 5-9 7) H ra 
转换 类 型 字符 。 

根据 常规 的 转换 说 明 ， 转 换 是 按照 它们 出 现在 format 参 数 之 后 的 
顺序 应 用 于 参数 的 。 一 种 替代 的 转换 说 明 语 法 也 允许 显 式 地 用 %n$ 序 列 
来 表示 第 n 个 参数 的 形式 来 命名 参数 。 注 意 ， 这 两 种 语法 不 能 在 同一 格 
式 说 明 中 混用 。 在 蔡 代 的 语法 中 ， 参 数 从 1 开始 计数 。 如 果 参 数 既 没 
有 提供 字段 宽度 和 也 没有 提供 精度 ， 通 配 符 星 号 的 语法 就 更 改 为 *m$， 
m 指 明 提 供 值 的 参数 的 位 置 。 


指数 格式 双 精 度 浮 点 数 
根据 转换 后 的 值 解释 为 £、F、e 或 E 


十 六 进 制 指数 格式 双 精 度 浮 点 数 


字符 《〈 若 带 长 度 修饰 符 1， 为 宽 字符 ) 

FAT Em KEMI, HEFE) 

指向 void 的 指针 

到 目前 为 止 , 此 printf 调用 输出 的 字符 的 数目 将 被 写 入 到 
指针 所 指 加 的 带 符号 整 型 中 

WBNS FFF 

REE (XSI, SRF lc) 

ATP XSI UE. SAF 1s) 


图 5-9 转换 说 明 中 的 转换 类 型 


下 列 5 种 printf 族 的 变 体 类 似 于 上 面 的 5 种 ， 但 是 可 变 参数 表 (.) 
替换 成 了 arg。 


#include <stdarg.h> 


#include <stdio.h> 
int vprintf(const char *restrict format, va_list arg); 
int vfprintf(FILE *restrict fp, const char *restrict format, va_list arg); 
int vdprintf(int fd, const char *restrict format, va_list arg); 
所 有 3 个 函数 返回 值 : ARD, AME, Amh eS, IE) 
值 
int vsprintf(char *restrict buf, const char *restrict format, va list arg); 
函数 返回 值 : Any, MEARS, 大 编码 出 错 ， 返 回 负 
值 
int vsnprintf(char *restrict buf, size t n, const char *restrict format, 
va list arg); 
KZOLEE: GK EK, EFACAR Awt H 
fa, KERE 
TEES BH E ENEMEF, AE H vsnprintfERZX © 
关于 ISO C 标 准 中 有 关 可 变 长 度 参 数 表 的 详细 说 明 请 参阅 Kernighan 
和 Ritchie[1988] 的 7.3 了 。 应 当 了 解 的 是 ， 由 ISO C 提 供 的 可 变 长 度 参数 
表 例 程 〈<stdarg.h> 头 文件 和 相关 的 例 程 ) 与 由 较 早 版 本 UNIX 提 供 的 
<varargs.h> 例 程 是 不 同 的 。 
2. 格式 化 输入 
执行 格式 化 输入 处 理 的 是 3 个 scanf 函 数 。 


include <stdio.h> 


int scanf(const char *restrict format, ...); 
int fscanf(FILE *restrict fp, const char *restrict format, ...); 
int sscanf(const char *restrict buf, const char *restrict format, ...); 
3S BORE: TEMA ATI, EPIS E TRECE EPS HRY CL STA 
AUF vin, OR[EIEOF 


scanf 族 用 于 分 析 输 入 字符 串 ， 并 将 字符 序列 转换 成 指定 类 型 的 变 
量 。 在 格式 之 后 的 各 参数 包含 了 变量 的 地 址 ， 用 转换 结果 对 这 些 变 量 
赋值 。 

格式 说 明 控 制 如 何 转 换 参 数 ， 以 便 对 它们 赋值 。 转 换 说 明 以 % 字 符 
开始 。 除 转换 说 明和 空 日 字符 外 ， 格 式 字 符 串 中 的 其 他 字符 必须 与 输 
入 匹配 。 着 有 一 个 字符 不 匹配 ， 则 停止 后 续 处 理 ， 不 再 读 输入 的 其 余 
部 分 。 

一 个 转换 说 明 有 3 个 可 选择 的 部 分 ， 下 面 将 它们 都 示 于 方 括号 中 : 

9o[ * |[fldwidth ][m ][lenmodifier]convtype 

可 选择 的 星 号 (*) 用 于 抑制 转换 。 按 照 转换 说 明 的 其 余部 分 对 输 
入 进行 转换 ， 但 转换 结果 并 不 存放 在 参数 中 。 

fldwidth 说 明 最 大 宽度 ( 即 最 大 字符 数 ) 。lenmodifier 说 明 要 用 转 
换 结 果 赋 值 的 参数 大 小 。 由 printf 函 数 族 支持 的 长 度 修 饰 符 同样 得 到 
scanf 族 函数 的 支持 ( 见 图 5-8 中 的 长 度 修饰 符 表 ) 。 

convtype 字 上 段 类 似 于 printf 族 的 转换 类 型 字段 ， 但 两 者 之 间 还 有 些 
差别 。 一 个 差别 是 ， 作 为 一 种 选项 ， 输 入 中 币 符 号 的 可 赋予 无 符号 类 
型 。 例 如 ， 输 入 流 中 的 -1 可 被 转换 成 4 294 967 295 赋 了 予 无 符号 整 型 变 
量 。 图 5-10 忌 结 了 scanf 族 函数 文 持 的 转换 类 型 。 

在 字段 宽度 和 长 度 修饰 符 之 间 的 可 选项 m 是 赋值 分 配 符 。 它 可 以 用 
于 %c、%s 以 及 %[ 转 换 从 ， 迫 使 内 存 缓冲 区 分 配 空 间 以 接纳 转换 字符 
串 。 在 这 种 情况 下 ， 相 关 的 参数 必须 是 指针 地 址 ， 分 配 的 缓冲 区 地 址 
必须 复制 给 该 指针 。 如 采 调 用 成 功 ， 该 缓冲 区 不 再 使 用 时 ， 由 调用 者 
人 负责 通过 调用 free 函 数 来 释放 该 缓冲 区 。 

scanf 函 数 族 同 样 文 持 另外 一 种 转换 说 明 ， 人 允许 显 式 地 命名 参数 : 
序列 gn$ 代 表 了 第 n 个 参数 。 与 printf 画 数 族 相同 ， 同 一 编号 的 参数 在 格 
式 串 中 可 引用 多 次 。 但 Single UNIX Specification 指 出 ， 这 种 情况 在 
scanf 芳 数 族 中 如 何 作用 还 未 定义 。 


转换 类 型 说 明 


有 符号 十 进 制 ， 基 数 为 10 

有 符号 十 进 制 ， 基 数 由 输入 格式 决定 

无 符号 八进制 (输入 可 选 地 有 符号 ) 

无 符号 十 进 制 ， 基 数 为 10 (输入 可 选 地 有 符号 ) 
xv X 无 符号 十 六 进 制 (输入 可 选 地 有 符号 ) 

a. Ay es Ex | PAR 

字符 ( 若 带 长 度 修饰 符 1， 为 宽 字 符 ) 

字符 串 〈 若 带 长 度 修饰 符 1， 为 宽 字符 串 ) 

匹配 列 出 的 字符 序列 ， 以 ] 终止 

匹配 除 列 出 字符 以 外 的 所 有 字符 ， 以 ] 终止 

指向 void 的 指针 

将 到 目前 为 止 该 函数 调用 读 取 的 字符 数 写 入 到 指针 所 指向 的 无 符号 整 型 中 

-个 % 符 号 

宽 字 符 (XSI 扩展 ， 等 效 于 1c) 

"eg MB (XSI 扩展， 等 效 于 1s) 


图 5-10 转换 说 明 中 的 转换 类 型 
与 printf 族 相同 ，scanf 族 也 使 用 由 <stdarg.h> 说 明 的 可 变 长 度 参 数 
Fo 


#include <stdarg.h> 


, 
, 


#include <stdio.h> 
int vscanf(const char *restrict format, va_list arg); 
int vfscanf(FILE *restrict fp, const char *restrict format, va_list arg); 
int vsscanf(const char *restrict buf, const char *restrict format, va_list 
arg); 
3 个 函数 返回 值 : TEENA, 大 输入 出 错 或 在 任 一 转换 前 文件 
结束 ， 返 回 EOF 

天 于 scanf 函 数 族 的 详细 情况 ， 请 参阅 UNIX 系 统 手册 。 


5.12 实现 细节 


正如 前 述 ， 在 UNIX 中 ， 标 准 MO 库 最 终 都 要 调用 第 3 章 中 说 明 的 IO 
例 程 。 每 个 标准 IO 流 都 有 一 个 与 其 相关 联 的 文件 描述 符 ， 可 以 对 一 个 
流 调 用 fileno 函 数 以 获得 其 摘 述 符 。 

注意 ，feno 不 是 ISO C 标 准 部 分 ， 而 是 POSIX.1 文 持 的 扩展 。 

#include <stdio.h> 

int fileno(FILE *fp); 

返回 值 : 与 该 流 相 关联 的 文件 摘 述 符 

如 果 要 调用 dup 或 fcntl 等 函数 ， 则 需要 此 画 数 。 

为 了 了 解 你 所 使 用 的 系统 中 标准 IO 库 的 实现 ， 最 好 从 头 文件 
<stdio.h> 开 始 。 从 中 可 以 看 到 FILE 对 象 是 如 何 定义 的 、 每 个 流标 志 的 
定义 以 及 定义 为 宏 的 各 个 标准 WO 例 程 (如 getc) ° Kernighan 和 
Ritchie[1988] 中 的 8.5 节 含有 一 个 示例 实现 ， 从 中 可 以 看 到 很 多 UNIX 实 
现 的 基本 样式 。Plauger[1992] 的 第 12 章 提供 了 标准 VO 库 一 种 实现 的 全 
部 源 代码 。GNU 标 准 WO 库 的 实现 也 是 公开 可 用 的 。 

实例 

图 5-11 程 序 为 3 个 标准 流 以 及 一 个 与 普通 文件 相关 联 的 流 打 印 有 关 
缓冲 的 状态 信息 。 


#include "apue.h" 


void pr stdio(const char *, FILE *); 
int is unbuffered(FILE *); 

int is linebuffered(FILE *); 

int buffer size(FILE *); 

int 


main (void) 
( 
FILE *fp; 


fputs("enter any character\n", stdout); 
if (getchar() == EOF) 
err sys("getchar error"); 
fputs("one line to standard errorMn", stderr); 


pr:stdio("stdin",; stdin); 
pr stdio("stdout", stdout); 
pr stdio("stderr", stderr); 


if ((fp = fopen("/etc/passwd", "r")) == NULL) 
err sys("fopen error"); 
if (getc(fp) == EOF) 


err sys("getc error"); 
pr stdio("/etc/passwd", fp); 
exit(0); 


void 
pr stdio(const char *name, FILE *fp) 
{ 
printf("stream = %s, ", name); 
if (is_unbuffered (fp) ) 
printf ("unbuffered") ; 
else if (is_linebuffered (fp) ) 
printf("line buffered") ; 
else /* if neither of above */ 
printf ("fully buffered"); 
printf(", buffer size = %d\n", buffer size(fp)); 


/* 
* The following is nonportable. 
E 


#if defined(_IO_UNBUFFERED) 


int 
is_unbuffered(FILE *fp) 


{ 
return(fp-» flags & IO UNBUFFERED) ; 


int 
is linebuffered(FILE *fp) 


{ 
return(fp->_flags & IO LINE BUF); 


int 
buffer size(FILE *fp) 
{ 
return(fp-» IO buf end - fp->_IO_buf_base); 


#elif defined( SNBF) 


aru 
is unbuffered(FILE *fp) 
{ 
return(fp->_flags & _ SNBF); 


int 
is_linebuffered(FILE *fp) 
{ 
return(fp->_flags & | SLBF); 


int 
buffer size(FILE *fp) 
( 
return(fp-» bf. size); 


) 


#elif defined( IONBF) 


#ifdef  LP64 

#define flag _ pad[4] 
#define ptr _ pad[1] 
#define base _ pad[2] 
#endif 


int 
is_unbuffered(FILE *fp) 
{ 
return(fp->_flag & _IONBF); 
} 


int 
is_linebuffered(FILE *fp) 
{ 
return (fp->_flag & _IOLBF); 
} 


int 
buffer_size(FILE *fp) 
{ 
#ifdef  LP64 
return (fp->_base - fp-» ptr); 
#else 
return (BUFSIZ) ; /* just a guess */ 
#endif 
} 


#else 


#error unknown stdio implementation! 


#endif 


图 5-11 对 各 个 标准 1/O 流 打印 缓冲 状态 信息 

注意 ， 在 打印 缓冲 状态 信息 之 前 ， 先 对 每 个 流 执行 O 操 作 ， 第 一 
个 IO 操作 通 香 束 造成 为 该 流 分 配 缓冲 区 。 本 例 中 的 结构 成 员 和 香 量 是 
由 本 书 中 使 用 的 4 种 平台 实现 的 标准 WO 库 定 义 的 。 应 当 了 解 ， 标 准 1O 
库 实 现在 不 同 的 系统 中 可 能 有 所 不 同 ， 像 本 例 中 的 程序 是 不 可 移植 
的 ， 因 为 它们 藤 入 了 与 特定 实现 相关 的 内 容 。 


如 


果 运 行 图 5-11 的 程序 两 次 ， 一 次 使 3 个 标准 流 与 终端 相连 接 ， 另 


一 次 使 它们 重 定向 到 普通 文件 ， 则 所 得 结果 是 : 
$ /a.out stdin 、stdout 和 stderr 都 连 至 终端 


enter any character 


键入 换行 符 


one line to standard error 


stream = stdin, line buffered, buffer size = 1024 


stream = stdout, line buffered, buffer size = 1024 


stream = stderr, unbuffered, buffer size = 1 


stream = /etc/passwd, fully buffered, buffer size = 4096 


$ ./a.out < /etc/group > std.out 2> std.err 


3 个 流 都 重 定向 ， 再 次 运行 该 程序 


$ cat std.err 


one line to standard error 


$ cat std.out 


enter any character 


stream = stdin, fully buffered, buffer size = 4096 


stream = stdout, fully buffered, buffer size = 4096 


stream = stderr, unbuffered, buffer size = 1 


stream = /etc/passwd, fully buffered, buffer size = 4096 

MPA, KARNES ERA ^ RIERA RIT, E 
们 是 行 缓冲 的 。 行 缓冲 的 长 度 是 1024 字 节 。 注 意 ， 这 并 没有 将 输入 、 
输出 的 行 长 限制 为 1 024 字 节 ， 这 只 是 缓冲 区 的 长 度 。 如 果 要 将 2 048 


FHN 


一 n 


{TS 


到 标准 输出 ， 则 要 进行 两 次 write 系统 调用 。 当 将 这 两 个 流 


重新 定 回 到 普通 文件 时 ， 它 们 束 变 成 是 全 缓冲 的 ， 其 缓冲 区 长 度 是 该 
文件 系统 优先 选用 的 VO KEE (从 stat 结构 中 得 到 的 st_blksize 值 ) 。 


从 中 也 可 看 到 ， 标 准 错误 如 它 所 应 该 的 那样 是 不 带 缓冲 的 ， 而 普通 文 
件 按 系 统 默 认 是 全 绥 促 的 。 


5.13 临时 文件 


ISO C 标准 VO 库 提 供 了 两 个 函数 以 帮助 创建 临时 文件 。 
#include<stdio.h> 
char *tmpnam(char *ptr); 
返回 值 : 指向 唯一 路 径 名 的 指针 
FILE *tmpfile(void); 
返回 值 : 者 成 功 ， 返 回 文件 指针 ; 大 出错 ， 返 回 NULL 
tmpnam 函数 产生 一 个 与 现 有 文件 名 不 同 的 一 个 有 效 路 径 名 字符 
串 。 每 次 调用 它 时 ， 都 产生 一 个 不 同 的 路 径 名 ， 最 多 调用 次 数 是 
TMP_MAX ° TMP_MAX 定义 在 <stdio.h> 中 。 
虽然 ISO C 定 义 了 TMP_MAX， 但 该 标准 只 要 求 其 值 至 少 应 为 25。 
但 是 ，Single UNIX Specification 却 要 求 符 合 XSI 的 系统 文 持 其 值 至 少 为 
10 000。 昌 然 此 最 小 值 允许 一 个 实现 使 用 4 位 数字 (0000~9999) 作为 
临时 文件 名 ， 但 是 ， 大 多 数 UNIX 实 现 使 用 的 却 是 大 、 小 写字 符 。 
tmpnam 函数 在 SUSv4 中 被 标记 为 弃 用 ,但 是 ISO C 标准 还 继续 
ARE” 
看 ptr 是 NULL， 则 所 产生 的 路 径 名 存放 在 一 个 静态 区 中 ， 指 网 该 静 
态 区 的 指针 作为 函数 值 返回 。 后 续 调 用 tmpnam 时 ， 会 重 写 该 静态 区 
(这 意味 着 ， 如 果 我 们 调用 此 画 数 多 次 ， 而 且 想 保存 路 径 名 ， 则 我 们 
应 当 保存 该 路 径 名 的 副本 ， 而 不 是 指针 的 副本 ) 。 如 若 ptr 不 是 NULL， 
则 认为 它 应 该 是 指向 长 度 至 少 是 L_tmpnam 个 字符 的 数组 (常量 


L_tmpnam 定 义 在 头 文件 <stdio.h> 中 ) 。 所 产生 的 路 径 名 存放 在 该 数组 


P, ptr te (EA KUERE] 。 
tmpfile 创建 一 个 临时 二 进 制 文件 (类 型 wb+) 


程序 结束 时 将 目 动 删除 这 种 文件 。 注 意 ，UNIX 对 二 


殊 区 分 
实例 
图 5-12 程 序 说 明了 这 两 个 函数 的 应 用 。 


在 关闭 该 文件 或 


进 制 文件 不 进 


TTE 


#include "apue.h" 


int 
main (void) 
{ 
charname[L_tmpnam], line [MAXLINE]; 


FILE *fp; 
printf ("%s\n", tmpnam(NULL) ) ， /* first temp name */ 
tmpnam (name) ; /* second temp name */ 


printf ("%s\n", name); 


if ((fp = tmpfile()) == NULL) /* create temp file */ 
err_sys("tmpfile error"); 
fputs("one line of output\n", fp); /* write to temp file */ 


rewind (fp); /* then read it back */ 
if (fgets(line, sizeof(line), fp) == NULL) 
err_sys("fgets error"); 
fputs(line, stdout); /* print the line we wrote */ 
exit (0); 


图 5-12 tmpnam 和 tmpfile 函 数 实例 


执行 图 5-12 的 程序 ， 可 得 : 
$ /a.out 

/tmp/fileTOHsu6 
/tmp/filekmAsYQ 


one line of output 


tmpfile 函 数 经 党 使 用 的 标准 UNIX 技 术 是 先 调用 tmpnam 产 生 一 个 唯 
一 的 路 径 名 ， 然 后 ， 用 该 路 径 名 创建 一 个 文件 ， 并 立即 unlink 它 。 请 回 
忆 4.15 万 ， 对 一 个 文件 解除 链接 并 不 删除 其 内 容 ， 天 闭 该 文件 时 才 删 除 
其 内 容 。 而 关闭 文件 可 以 是 显 式 的， 也 可 以 在 程序 终止 时 自动 进行 。 

Single UNIX Specification 为 处 理 临 时 文件 定义 了 另外 两 个 函数 ; 
mkdtemp 和 mkstemp， 它 们 是 XSI 的 扩展 部 分 。 

#include <stdlib.h> 

char *mkdtemp(char *template); 

返回 值 : Bt, WSR HGRAABHUTHET: ats, iKIEINULL 
int mkstemp(char *template); 
返回 值 : 大 成 功 ， 返 回 文件 描述 符 ; ate, Xx[H-1 

mkdtemp 函数 创建 了 一 个 目 孙 ， 该 目 孙 有 一 个 唯一 的 名 字 
mkstemp 函 数 创建 了 一 个 文件 ， 该 文件 有 一 个 唯一 的 名 字 。 和 名字 是 通过 
template 字 符 串 进行 选择 的 。 这 个 字符 串 是 后 6 位 设置 为 XXXXXX 的 路 
径 名 。 男 数 将 这 些 占 位 符 替 换 成 不 同 的 字符 来 构建 一 个 唯一 的 路 径 
名 。 如 宁 成 功 的 话 ， 这 两 个 畏 数 将 修改 template 字 符 串 反映 临时 文件 的 
Ag. o 

Fi mkdtemp EX 2 8 E HJ H 3 E FH. P 9 D; RUBUS ic SS: S. IRUSR | 
S_IWUSR | S_IXUSR。 注 意 ， 调 用 进程 的 文件 模式 创建 屏蔽 字 可 以 进 
一 步 限制 这 些 权 限 。 如 有 果 目 录 创 建成 功 ，mkdtemp 返 回 新 目录 的 名 字 。 

mkstemp 函 数 以 唯一 的 名 字 创 建 一 个 普通 文件 并 且 打 开 该 文件 ， 该 
函数 返回 的 文件 描述 符 以 读 写 方式 打开 。 由 mkstemp 创 建 的 文件 使 用 访 
问 权 限 位 S_IRUSR | S IWUSR ° 

与 tempfile 不 同 ，mkstemp 创 建 的 临时 文件 并 不 会 自动 删除 。 如 果 
希望 从 文件 系统 命名 空间 中 删除 该 文件 ， 必 须 自己 对 它 解除 链接 。 

使 用 tmpnam 和 tempnam 至 少 有 一 个 缺点 ， 在 返回 唯一 的 路 径 名 和 
用 该 名 字 创 建文 件 之 间 存 在 一 个 时 间 窗 口 ， 在 这 个 时 间 窗 口中 ， 男 一 


进程 可 以 用 相同 的 名 字 创 建文 件 。 因 此 应 该 使 用 tmpfile 和 mkstemp 画 
数 ， 因 为 它们 不 存在 这 个 问题 。 

实例 

图 5-13 程 序 显 示 了 如 何 使 用 mkstemp 范 数 。 


#include "apue.h" 
#include <errno.h> 


void make temp (char *template); 


int 
main() 
( 
char good template[] = "/tmp/dirXXXXXX"; /* right way */ 
char *bad template - "/tmp/dirXXXXXX"; /* wrong way*/ 
printf("trying to create first temp file...\n"); 
make temp (good template); 
printf("trying to create second temp file...\n"); 
make temp (bad template); 
exit (0); 
} 
void 


make_temp(char *template) 
{ 
int fd; 
struct stat  sbuf; 


if ((fd = mkstemp(template)) « 0) 
err sys("can't create temp file"); 


printf("temp name = %s\n", template); 
close(fd); 
if (stat(template, &sbuf) < 0) { 

if (errno == ENOENT) 


printf("file doesn't exist\n"); 
else 
err sys("stat failed"); 
} else. 1 


printf("file exists Win"); 
unlink(template); 


图 5-13 mkstemp ER ZA 5 Sz FA 
运行 图 5.13 中 的 程序 ， 得 到 ; 


$ /a.out 

trying to create first temp file... 

temp name = /tmp/dirUmBT7h 

file exists 

trying to create second temp file... 

Segmentation fault 

WAIT BR AF FR A CES A IE RT AN TR IAT ZAR * LT SR 
一 个 模板 ， 因 为 使 用 了 数组 ， 名 字 是 在 栈 上 分 配 的 。 但 第 二 种 情况 使 
用 的 是 指针 ， 在 这 种 情况 下 ， 只 有 指针 自身 驻 留 在 栈 上 。 编 译作 把 字 
符 串 存放 在 可 执行 文件 的 只 读 段 ， 当 mkstemp 函数 试图 修改 字符 串 
ET, EITE (segment fault) 


5.14 Ain 


我 们 已 经 看 到 ， 标 准 MO 库 把 数据 缓存 在 内 存 中 ， 因 此 每 次 一 字符 
和 每 次 一 行 的 O 更 有 效 。 我 们 也 可 以 通过 调用 setbuf 或 setvbuf 函 数 让 
IO 库 使 用 我 们 自己 的 缓冲 区 。 在 SUSv4 中 支持 了 内 存 流 。 这 就 是 标准 
IO 流 ， 虽 然 仍 使 用 FILE 指 针 进 行 访问 ， 但 其 实 并 没有 底层 文件 。 所 有 
的 VO 都 是 通过 在 缓冲 区 与 主 存 之 间 来 回 传送 字 市 来 完成 的 。 我 们 将 看 
到 ， 即 便 这 些 法 看 起 来 像 文 件 流 ， 它 们 的 某 些 特征 使 其 更 适用 于 字符 
FABRE ° 

AINKA AFA FAB, 28 — X fmemopenEN RX ° 


#include <stdio.h> 


FILE *fmemopen(void *restrict buf, size_t size, const char *restrict 
type); 
返回 值 : EARD, REI: 者 错误 ， 返 回 NULL 


fmemopen EX 25 fo YF id Aa eA DC FIT VAT: buf 参数 指 癌 
PIX AFP RRL, size XE I 2: KAZ SF AK 9 HR buf 
BAZ, fmemopenEN 23 7 BtsizeF D 2X BJZ& X ^ ERROR, Zi 
天 闭 时 缓冲 区 会 被 释放 。 

type 参 数控 制 如 何 使 用 流 。type 可 能 的 取 值 如 图 5-14 所 示 。 


r H rb 为 读 而 打开 
w 或 wb 为 写 而 打开 


a M ab 追加 ;为 在 第 一 个 null 字 节 处 写 而 打开 
r+ 或 zx+b BK rb+ 为 读 和 写 而 打开 
w+ 或 wtb BK wb 把 文件 截断 至 0 长 ， 为 读 和 写 而 打开 
a+ 或 a+b BK ab+ 追加 ; 为 在 第 一 个 null 字 节 处 读 和 写 而 打开 


图 5-14 打开 内 存 流 的 type 参 数 

注意 ， 这 些 取 值 对 应 于 基于 文件 的 标准 IO 流 的 type 参 数 取 值 ， 但 
其 中 有 些微 小 差别 。 第 一 ， 无 论 何 时 以 追加 写 方式 打开 内 存 流 时 ， 当 
前 文件 位 置 设 为 缓 神 区 中 的 第 一 个 nul 字 和 。 如 条 缓 神 区 中 不 存在 null 
字 广 ， 则 当前 位 置 束 设 为 缓冲 区 结尾 的 后 一 个 他方 。 当 流 并 不 是 以 人 退 
加 写 方式 打开 时 ， 当 前 位 置 设 为 缓冲 区 的 开始 位 置 。 因 为 追加 写 模 式 
通过 第 一 个 null 字 广 确 定数 据 的 尾 端 ， 内 存 流 并 不 适合 存储 二 进 制 数 据 

(二 进 制 数据 在 数据 尾 端 之 前 就 可 能 包含 多 个 null 字 节 ) 。 

第 二 ， 如 采 buf 参 数 是 一 个 null 指 针 ， 打 开 流 进行 读 或 者 写 都 没有 
任何 意义 。 因 为 在 这 种 情况 下 缓冲 区 是 通过 fmemopen 进 行 分 配 的 ， 没 
有 办 法 找到 缓冲 区 的 地 址 ， 只 写 方式 打开 流 意味 着 无 法 读 取 已 写 入 的 
数据 ， 同 样 ， 以 读 方 式 打开 流 意味 着 只 能 读 取 那 些 我 们 无 法 写 入 的 组 
冲 区 中 的 数据 。 


第 三 ， 任 何 时 候 需 要 增加 流 缓 冲 区 中 数据 量 以 及 调用 fclose、 
fflush、fseek、fseeko 以 及 fsetpos 时 都 会 在 当前 位 置 写 入 一 个 null 字 世 。 

实例 

有 必要 看 一 下 对 内 存 流 的 写 入 是 如 何在 我 们 自己 提供 的 缓冲 区 上 
进行 操作 的 。 图 5-15 给 出 了 用 已 知 模式 填充 缓冲 区 时 流 写 入 是 如 何 操 作 
的 。 我 们 在 Linux 上 运行 该 程序 ， 得 到 如 下 结 


#define BSZ 48 


int 
main() 
{ 
FILE *fp; 
char buf[BSZ]; 


memset (buf, 'a', BSZ-2); 


buf [BSZ-2] = 'N0'; 
buf[BSZ-1] = 'X'; 
if ((fp = fmemopen (buf, BSZ, "w+")) == NULL) 


err sys("fmemopen failed"); 
printf("initial buffer contents: %s\n", buf); 
fprintf(fp, "hello, world"); 
printf("before flush: $sMn", buf); 
fflush(fp); 
printf("after fflush: $sin"; buf); 
printf("len of string in buf = %ld\n", (long)strlen(buf)); 


memset(buf, 'b', BSZ-2); 

buf [BSZ-2] TRON 

buf [BSZ-1] MUR 

fprintf(fp, "hello, world"); 
fseek(fp, 0, SEEK SET); 
printf("after fseek: %s\n", buf); 


printf("len of string in buf = $1dMn", (long)strlen(buf)); 


memset(buf, 'c', BSZ-2); 

buf [BSZ-2] TRONS 

buf [BSZ-1] be 
fprintf(fp, "hello, world"); 
fclose (fp); 


printf("after fclose: %s\n", buf); 
printf("len of string in buf = %ld\n", (long)strlen(buf)); 


return(0); 


图 5-15 观察 内 存 流 的 写 入 操作 

$ /a.out 

initial buffer contents: fmemopen 在 缓冲 区 开始 处 
放置 nul] 字 全 

before flush: 

after fflush: hello, world 

len of string in buf = 12 null T JH] 5 E ZEE 

用 a 字符 改写 缓冲 区 

流 冲 洗 后 缓冲 区 才 会 变化 

现在 用 b 字 符 改写 绥 冲 区 

after fseek: bbbbbbbbbbbbhello, world fseek 引 起 绥 冲 区 冲洗 

len of string in buf = 24 BAREM E nlr 

m Æ Ae 7 HF KM 5 E th [X after fclose: hello, 
worldcccccccccccccccccccccccccccccccccc 

len of string in buf = 46 C EIMS null 5 

这 个 例子 给 出 了 冲洗 内 存 流 和 人 退 加 写 null 字 广 的 策略 。 写 入 内 存 流 
以 及 推进 流 的 内 容 大 小 (相对 缓冲 区 大 小 而 言 ， 该 大 小 是 固定 的 ) 这 
个 概念 时 ，null 字 节 会 自动 追加 写 。 流 内 容 大 小 是 由 写 入 多 少 来 确定 
的 。 


在 本 书 所 讨论 的 4 个 平台 中 ， 只 有 Linux 3.2.0 文 持 内 存 流 。 这 是 具 
体 实 现 还 没有 跟 上 最 新 的 标准 ， 相 信 随 着 时 间 的 推移 ， 这 种 情况 会 有 
所 改变 。 

用 于 创建 内 存 流 的 其 他 两 个 函数 分 别 是 open_memstream 和 


open wmemstream ° 


include <stdio.h> 


FILE *open memstream(char **bufp, size t *sizep); 

#include <wchar.h> 

FILE *open_wmemstream(wchar_t **bufp, size_t *sizep); 

PY TP RSI: ARI, RERE: Aht, XX[BINULL 

open memstream EX 2X il] AY Vit ze [Al [H] <= “77 HJ, open wmemstream 
EK R 8] EY Tit ze BEN (5.20 "FOL F e EC SE IEBU V 
HA) e ix PRA ERA fmemopen ES ZU A aI EF: 

“创建 的 流 只 能 写 打开 

“不 能 指定 目 己 的 缓冲 区 ， 但 可 以 分 别 通过 bufp 和 sizep 参 数 访问 组 
冲 区 地 址 和 大 小 :; 

“关闭 流 后 需要 自行 释放 缓冲 区 ; 

"对 流 添 加 字 广 会 增加 缓冲 区 大 小 。 

但 是 在 缓冲 区 地 址 和 大 小 的 使 用 上 必须 遵循 一 些 原则 。 第 一 ， 缓 
冲 区 地 址 和 长 度 只 有 在 调用 fclose 或 fflush 后 才 有 效 ; 第 二 ， 这 些 值 只 有 
在 下 一 次 流 写 入 或 调用 fclose 前 才 有 效 。 因 为 缓 促 区 可 以 增长 ， 可 能 需 
要 重新 分 配 。 如 果 出 现 这 种 情况 ， 我 们 会 发 现 缓冲 区 的 内 存 地 址 值 在 
下 一 次 调用 fclose 或 flush 时 会 改变 。 

因为 避免 了 缓冲 区 次 出 ， 内 存 流 非 党 适用 于 创建 字符 串 。 因 为 内 
存 流 只 访问 主 存 ， 不 访问 磁盘 上 的 文件 ， 所 以 对 于 把 标准 IO 流 作 为 参 
数 用 于 临时 文件 的 函数 来 说 ， 会 有 很 大 的 性 能 提升 。 


5.15 FREIO H 


标准 MO 库 并 不 完善 。Korn 和 Vo[1991] 列 出 了 它 的 很 多 不 足 之 处 ， 
其 中 ， 某 些 属于 基本 设计 ， 但 是 大 多 数 则 与 各 种 不 同 的 实现 有 天 。 


标准 WO 库 的 一 个 不 足 之 处 是 效率 不 高 ， 这 与 它 需 要 复制 的 数据 量 
有 关 。 当 使 用 每 次 一 行 玉 数 fgets 和 fputs 时 ， 通 常 需要 复制 两 次 数据 : 
一 次 是 在 内 核 和 标准 LO 缓冲 区 之 间 〈 当 调用 read 和 write 时 ) ， 第 二 次 
是 在 标准 MO 缓冲 区 和 用 户 程序 中 的 行 缓冲 区 之 间 。 人 快速 IO 库 [AT&T 
1990a 中 的 fio(3) Ho f 3x — R, HD EEEE 131 8J ERROR [8] $8 I8] AR 
行 的 指针 ， 而 不 是 将 该 行 复制 到 男 一 个 缓冲 区 中 。Hume[1988] 报 告 : 
由 于 做 了 这 种 更 改 ，grep(1) 实 用 程序 的 速度 提升 了 3 倍 。 

Korn 和 Vo[1991] 说 明了 标准 MO 库 的 另 一 种 替代 版 : sfio。 这 一 软件 
包 在 速度 上 与 fo 相近， 通常 快 于 标准 MO 库 。sfio 软 件 包 也 提供 了 一 些 
其 他 标准 IO 库 所 没有 的 新 特征 : 推广 了 IO 流 ， 使 其 不 仅 可 以 代表 文 
件 ， 也 可 代表 存储 区 ; 可 以 编写 处 理 模块 ， 并 以 栈 方式 将 其 压 入 LO 
流 ， 这 样 就 可 以 改变 一 个 法 的 操作 ; 较 好 的 异常 处 理 等 。 

Krieger、Stumm 和 Unrau[1992] 说 明了 另 一 个 替代 软件 包 ， 它 使 用 
了 映射 文件 一 一 mmap 函 数 ， 我 们 将 在 14.8 节 中 说 明 此 函数 。 该 新 软件 
包 称 为 ASI (Alloc Stream Interface) 。 其 编程 接口 类 似 于 UNIX 系 统 存 
储 分 配 函 数 (malloc、realloc 和 free， 这 些 函 数 将 在 7.8 节 中 说 明 ) 。 与 
sfio 软 件 包 相 同 ，ASI 使 用 指针 力图 减少 数据 复制 量 。 

许多 标准 VO 库 实现 在 C 函 数 库 中 可 用 ， 这 种 C 函 数 库 是 为 内 存 较 小 
的 系统 ， 如 般 入 式 系统 设计 的 。 这 些 实现 对 于 合理 内 存 要 求 的 天 注 超 
过 对 可 移植 性 、 速 度 以 及 功能 性 等 方面 的 关注 。 这 种 类 型 本 数 库 的 两 
种 实现 是 : uClibc CE (参阅 http://www.uclibc.org) 和 Newlib C JÆ 


(http://www. source.redhat.com/newlib) 。 


5.16 小 结 


大 多 数 UNIX 应 用 程序 都 使 用 标准 WO 库 。 本 章 说 明了 该 库 提供 的 很 
多 函数 以 及 某 些 实现 细 市 和 效率 方面 的 考虑 。 应 该 看 到 ， 标 准 1/O 库 使 
用 了 绥 冲 技术 ， 而 它 正 古 产 生 很 多 问题 、 引 起 许多 温 清 的 部 分 


习题 


5.1 用 setvbuf 实 现 setbuf ° 

5.2 图 5-5 中 的 程序 利用 每 次 一 行 WO (fgets Fl fputs EN Be) 复制 文 
件 。 若 将 程序 中 的 MAXLINE 改 为 4， 当 复制 的 行 超过 该 最 大 值 时 会 出 
现 什 么 情况 ? 对 此 进行 解释 。 

5.3 printf [HO (E Sz RT A ? 

5.4 下面 的 代码 在 一 些 机 器 上 运行 正确 ， 而 在 另外 一 些 机 器 运行 时 
出 错 ， 解 释 问 题 所 在 。 


#include <stdio.h> 


int 
main(void) 
{ 

char c; 

while ((c = getchar()) != EOF) 

putchar(c); 
} 
5.5 对 标准 IO 流 如 何 使 用 fsync 范 数 (003.1315) ? 
5.6 在 图 1-7 和 图 1-10 程 序 中 ， 打 印 的 提示 信息 没有 包含 换行 符 ， 程 
序 也 没有 调用 fflush 函 数 ， 请 解释 输出 提示 信息 的 原因 是 什么 ? 

5.7 基于 BSD 的 系统 提供 了 funopen 的 函数 调用 使 我 们 可 以 拦截 读 、 
` 定位 以 及 关闭 一 个 流 的 调用 。 使 用 这 个 函数 为 FreeBSD 和 Mac OS 


X 实 现 fmemopen。 


6.1 2| E 


UNIX 系 统 的 正常 运作 需要 使 用 大 量 与 系统 有 关 的 数据 文件 ， 例 
如 ， 口 令 文 件 /etcpasswd 和 组 文件 /etcgroup 就 是 经 常 被 多 个 程序 频 党 使 
用 的 两 个 文件 。 用户 每 次 登录 UNIX 系 统 ， 以 及 每 次 执行 1s -1 命令 时 都 
要 使 用 口令 文件 。 

由 于 历史 原因 ， 这 些 数据 文件 都 是 ASCII 文 本 文件 ， 并 且 使 用 标准 
1/O 库 读 这 些 文件 。 但 是 ， 对 于 较 大 的 系统 ， 顺 序 扫描 口令 文件 很 花费 
时 间 ， 我 们 需要 能 够 以 非 ASCIT 文 本 格式 存放 这 些 文件 ， 但 仍 同 使 用 其 
他 文件 格式 的 应 用 程序 提供 接口 。 对 于 这 些 数据 文件 的 可 移植 接口 是 
本 章 的 主题 。 本 章 也 包括 了 系统 标识 函数 、 时 间 和 日 期 函数 。 


6.2 口令 文件 


UNIX 系统 口令 文件 (POSIX.1 则 将 其 称 为 用 户 数 据 库 ) 包含 了 图 
6-1 中 所 示 的 各 字段 ， 这 些 字段 包含 在 <pwd.h> 中 定义 的 passwd 结 构 
中 o 

注意 ，POSIX.1 只 指定 passwd 结 构 包 含 的 10 个 字段 中 的 5 个 。 大 多 
数 平台 至 少 支 持 其 中 7 个 字段 。BSD 派 生 的 平台 支持 全 部 10 个 字段 。 


BT » pi FreeBSD | Linux Mac OS cof 
说 明 struct passwd 成 员 POSIX.1 8.0 320 | x1068 | Solaris 10 


用 户 名 char *pw name 
加 密 口 令 char *pw passwd 
数值 用 户 ID uid t pw uid 
数值 组 ID gid t pw gid 
注释 字段 char *pw gecos 
初始 工作 目录 char *pw dir 
初始 shell (用 户 程序 ) | char *pw shell 
用 户 访 问 类 char *pw class 
下 次 更 改口 令 时 间 time t pw change 
账户 有 效 期 时 间 time t pw expire 


图 6-1 /etc/passwd 文 件 中 的 字段 


由 于 历史 原因 ， 口 令 文 件 是 /etc/passwd， Ls ASCII 文件 。 


每 一 行 包含 图 6-1 中 所 示 的 各 字段 ， 字 段 之 间 用 冒号 分 隔 。 例 如 ， 在 
Linux 中 ， 该 文件 中 可 能 有 下 列 4 行 


root:x:0:0:root:/root:/bin/bash 


squid:x:23:23::/var/spool/squid:/dev/null 

nobody:x:65534:65534: Nobody:/home:/bin/sh 

sar:x:205:105:Stephen Rago:/home/sar:/bin/bash 

关于 这 些 登 录 项 ， 请 注意 下 列 各 点 : 

“通常 有 一 个 用 户 名 为 root 的 登录 项 ， 其 用 户 ID 是 0 〈 超 级 用 户 ) 。 

- 加密 口令 字段 包含 了 一 个 占 位 符 。 较 早期 的 UNIX 系 统 版 本 中 ， 
该 字段 存放 加 密 口令 字 。 将 加 密 口令 字 存 放 在 一 个 人 人 可 读 的 文件 中 
是 一 个 安全 性 漏洞 ， 所 以 现在 将 加 密 口 令 字 存放 在 男 一 个 文件 中 。 在 
下 一 贡 讨 论 口 令 字 时 ， 我 们 将 详细 涉及 此 问题 。 

“口令 文件 项 中 的 某 些 字段 可 能 是 空 。 如 采 加 密 口 令 字 段 为 空 ， 这 
通常 就 意味 着 该 用 户 没有 口令 〈 不 推荐 这 样 做 ) 。squid 登 录 项 有 一 罕 
AFR: 注释 字段 。 空 日 注释 字段 不 产生 任何 影响 。 

。shell 字 段 包 含 了 一 个 可 执行 程序 名 ， 它 被 用 作 该 用 户 的 登录 
shell。 大 该 字段 为 空 ， 则 取 系 统 默认 值 ， 通 常 是 /bin/sh。 注 意 ，squid 登 


杂项 的 该 字段 为 /dev/null。 显 然 ， 这 是 一 个 设备 ， 不 是 可 执行 文件 ,将 
其 用 于 此 处 的 目的 是 ， 阻 止 任何 人 以 用 户 squid 的 名 义 登 录 到 该 系统 

很 多 服务 对 于 帮助 它们 得 以 实施 的 不 同 守护 进程 使 用 不 同 的 用 户 
ID 〈 见 第 13 章 ) ，squid 项 是 为 实现 squid 代 理 高 速 缓存 服务 的 进程 设置 
的 。 

“为 了 阻止 一 个 特定 用 户 登 录 系 统 ， 除 使 用 /devnul 外 ， 还 有 者 干 
种 奉 代 方法 。 第 见 的 一 种 方法 是 ， 将 /bin/false 用 作 登 录 shell。 它 简单 
地 以 不 成 功 (GEO) 状态 终止 ， 该 shell 将 此 种 终止 状态 判断 为 假 。 另 一 
PH is UL Re 用 foin/true d 个 账户 。 它 所 做 的 一 切 是 以 成 功 

(0) 状态 终止 。 某 些 系统 提供 nologin 命令 ， 它 打印 可 定制 的 出 错 信 
妃 ， 然 后 以 非 0 状 态 终止 

。 使 用 nobody 用 户 名 的 一 个 目的 是 ， 使 任何 人 都 可 登录 至 系统 ， 但 
其 用 户 ID (65534) 和 组 ID (65534) 不 提供 任何 特权 。 该 用 户 ID 和 组 
ID 只 能 访问 人 人 人缘 可 读 、 写 的 文件 。 (假定 用 户 ID 65534 和 组 ID 65534 
并 不 拥有 任何 文件 ， 而 实际 情况 就 应 如 此 。) 

- 提供 finger(1) AEAEE UNIX 系统 支持 注释 字段 中 的 附加 信 
Ae, Saba Zea S obey: 用 户 姓 名 、 办 公 室 地 点 、 办 公 
室 电 话 号 码 以 及 家 庭 电话 号 码 等 。 男 外 ， 如 果 注 释 字 段 中 的 用 户 姓 名 
是 一 个 &， 则 它 被 蔡 换 为 登录 名 。 例 如 ， 可 以 有 下 列 记录 : 

Sar:x:205:105:Steve Rago, SF 5-121, 555-1111, 555- 
2222:/home/sar:/bin/sh 

使 用 finger 命 令 就 可 打印 Steve Rago 的 有 关 信 息 。 

$ finger -p sar 


Login: sar Name: Steve Rago 
Directory: /home/sar Shell: /bin/sh 
Office: SF 5-121, 555-1111 Home Phone: 555- 


2222 


On since Mon Jan 19 03:57 (EST) on ttyvO (messages off) 

No Mail. 

即使 你 所 使 用 的 系统 并 不 文 持 finger 命 令 ， 这 些 信息 仍 可 存放 在 注 
释 字 段 中 ， 该 字段 只 是 一 个 注释 ， 并 不 由 系统 实用 程序 解释 。 

某 些 系统 提供 了 vipw 命令 ， 人 允许 管理 员 使 用 该 命令 编辑 口令 文 
件 。vipw 命令 串 行 化 地 更 改口 令 文件 ， 并 且 确 保 它 所 做 的 更 改 与 其 他 
相关 文件 保持 一 致 。 系统 也 常常 经 由 图 形 用 户 界 面 (GUD 提供 类 似 的 
功能 。 

POSIX.1 定 义 了 两 个 获取 口令 文件 项 的 函数 。 在 给 出 用 户 登 录 名 或 
数值 用 户 ID 后 ， 这 两 个 函数 区 能 查看 相关 项 。 


#include<pwd.h>struct passwd *getpwuid(uid t uid);struct passwd 


*getpwnam(const char *name); 
AYP ROR: ERD, REM; 知 出 错 ， 返 回 NULL 

getpwuid 函 数 由 ls(1) 程 序 使 用 ， 它 将 i 节 点 中 的 数字 用 户 ID 映 射 为 
用 户 登 录 名 。 在 键入 登录 名 时 ，getpwnam 函 数 由 login(1) 程 序 使 用 。 

这 两 个 函数 都 返回 一 个 指向 passwd 结 构 的 指针 ， 该 结构 已 由 这 两 
个 函数 在 执行 时 填 入 信息 。passwd 结构 通常 是 函数 内 部 的 静态 变量 ， 
只 要 调用 任 一 相关 函数 ， 其 内 容 束 会 被 重 写 。 

如 果 要 得 看 的 只 是 登录 名 或 用 户 ID， 那 么 这 两 个 POSIX.1 函 数 能 满 
足 要 求 ， 但 是 也 有 些 程序 要 碍 看 整个 口令 文件 。 下 列 3 个 函数 则 可 用 于 
此 种 目的 。 

#include <pwd.h> 


struct passwd *getpwent(void); 
返回 值 : 者 成 功 ， 返 回 指针 ;者 出 钳 或 到 达 文 件 尾 病 ， 返 回 NULL 
void setpwent(void); 


void endpwent(void); 


基本 POSIX.1 标 准 没 有 定义 这 3 个 函数 。 在 Single UNIX 
Specification 中 ， 它 们 被 定义 为 XSI 扩 展 。 因 此 ， 可 预期 所 有 UNIX 实 现 
都 将 提供 这 些 函 数 。 

调用 getpwent 时 ， 它 返回 口令 文件 中 的 下 一 个 记录 项 。 如 同上 面 所 
壕 的 两 个 POSIX.1 函 数 一 样 ， 它 返回 一 个 由 它 填写 好 的 passwd 结构 的 
指针 。 每 次 调用 此 函数 时 都 重 写 该 结构 。 在 第 一 次 调用 该 函数 时 ， 它 
打开 它 所 使 用 的 各 个 文件 。 在 使 用 本 函数 时 ， 对 口令 文件 中 各 个 记录 
项 的 安排 顺序 并 无 要 求 。 某 些 系 统 采用 散 列 算法 对 /etc/passwd 文件 中 
各 项 排序 。 

函数 setpwent 反 绕 它 所 使 用 的 文件 ，endpwent 则 关闭 这 些 文件 。 在 
使 用 getpwent 查 看 完 口 令 文 件 后 ， 一 定 要 调用 endpwent 天 闭 这 些 文件 。 
getpwent 知 道 什 么 时 间 应 当 打 开 它 所 使 用 的 文件 (第 一 次 被 调用 时 ) ， 
但 是 它 并 不 知道 何 时 关闭 这 些 文件 。 

实例 

图 6-2 程 序 给 出 了 getpwnam 函 数 的 一 个 实现 。 


#include <pwd.h> 
#include <stddef.h> 
#include <string.h> 


struct passwd * 
getpwnam(const char *name) 
{ 


struct passwd *ptr; 


setpwent(); 
while ((ptr = getpwent()) !- NULL) 
if (strcmp (name, ptr-»pw name) == 0) 


break; /* found a match */ 
endpwent (); 
return (ptr) ; /* ptr is NULL if no match found */ 


图 6-2 getpwnam AK 


在 函数 开始 处 调用 setpwent 是 目 我 保护 性 的 措施 ， 以 便 确 保 如 采 调 
用 者 在 此 之 前 已 经 调用 getpwent 打 开 了 有 关 文 件 情 况 下 ， 反 绕 有 关 文 件 
使 它们 定位 到 文件 开始 处 。getpwnam 和 getpwuid 完 成 后 不 应 使 有 关 文 
件 仍 处 于 打开 状态 ， 所 以 应 调用 endpwent 天 闭 它 们 。 


6.3 阴影 口令 


加 窗口 令 是 经 单 癌 加 密 算 法 处 理 过 的 用 户口 令 副 本 。 因 为 此 算法 
是 单 同 的 ， 所 以 不 能 从 加 密 口令 猜测 到 原来 的 口令 。 

历史 上 使 用 的 算法 总 是 在 64 字 符 集 [a-zA-Z0-9./] 中 产生 13 个 可 打印 
字符 (I Morris #1 Thompson [1979]) 。 某 些 较 新 的 系统 使 用 其 他 方 
法 ， 如 MD5 或 SHA-1 算 法 ， 对 口令 加 密 ， 产 生 更 长 的 加 密 口令 字符 
Po (加 和 密 口 令 的 字符 越 多 ， 这 些 字 符 的 组 合 也 就 越 多 ， 于 是 用 各 种 
可 能 组 合 来 猜测 口令 的 难度 就 越 大 。) 当 我 们 将 单个 字符 放 在 加 密 口 
令 字 段 中 时 ， 可 以 确保 任 一 加 密 口 令 都 不 会 与 其 相 匹配 。 

对 于 一 个 加 密 口令 ， 找 不 到 一 种 算法 可 以 将 其 反 变 换 到 明文 口令 

(明文 口令 是 在 Password: 提 示 后 键入 的 口令 ) 。 但 是 可 以 对 口令 进行 

猜测 ， 将 猫 测 的 口令 经 单 辐 算法 变换 成 加 密 形 式 ， 然 后 将 其 与 用 户 的 
加 密 口 令 相 比较 。 如 果 用 户口 令 是 随机 选择 的 ， 那 么 这 种 方法 并 不 是 
很 有 用 。 但 是 用 户 往往 以 非 随机 方式 选择 口令 《如 配偶 的 姓名 、 街 
和 名、 宠物 名 等 ) 。 一 个 经 常 重复 的 实验 是 和 完 得 到 一 份 口令 文件 ， 然 后 
用 试探 方法 猜测 口令 。 (Garfinkel 等 [2003] 的 第 4 章 对 UNIX 口 令 及 口令 
加 密 处 理 方案 的 历史 情况 及 细 市 进行 了 说 明 。) 

为 使 企图 这 样 做 的 人 难以 获得 原始 资料 (加密 口 令 ) , ME, X 
些 系 统 将 加 密 口 令 存 放 在 另 一 个 通常 称 为 阴影 口令 (shadow 


password) 的 文件 中 。 该 文件 至 少 要 包含 


用 户 名 和 加 密 口令 。 与 该 口令 


相关 的 其 他 信息 也 可 存放 在 该 文件 中 (图 6-3) 。 


用 户 登 录 名 char *sp_namp 
加 密 口令 char *sp pwdp 


上 次 更 改口 令 以 来 经 过 的 时 间 
经 多 少 天 后 允许 更 改 

要 求 更 改 尚 余 天 数 

超期 警告 天 数 

账户 不 活动 之 前 尚 余天 数 
账户 超期 天 数 


sp lstchg 
sp min 

sp max 

Sp warn 
Sp inact 


Sp expire 


保留 unsigned int sp flag 


图 6-3 /etc/shadow X fF H 


的 字段 


只 有 用 户 登 录 名 和 加 密 口令 这 两 个 字段 是 必须 的 。 其 他 的 字段 控 
制 口令 更 改 的 频率 ， 或 者 说 口令 的 衰老 以 及 账户 仍然 处 于 活动 状态 的 


时 间 。 


阴影 口令 文件 不 应 是 一 般 用 户 可 以 读 取 的 。 仅 有 少数 几 个 程序 需 
要 访问 加 密 口令 ， 如 login(1) 和 passwd(1)， 这 些 程序 常常 是 设置 用 户 
ID 为 root 的 程序 。 有 了 阴影 口令 后 ， 普 通 口令 文件 /etc/passwd 可 由 各 


用 户 目 由 读 取 。 
在 Linux 3.2.0 和 Solaris 10 中 ， 与 访问 
有 另 一 组 函数 可 用 于 访问 阴影 口令 文件 。 


include <shadow.h> 


口令 文件 的 一 组 函数 相 类 似 ， 


struct spwd *getspnam(const char *name); 


struct spwd *getspent(void); 


两 个 函数 返回 值 : ÆR, REJ: Hite, JEIBINULL 


void setspent(void); 


void endspent(void); 
在 FreeBSD 8.0 和 Mac OS X 10.6.8 中 ， 没 有 阴影 口令 结构 。 附 加 的 
账户 信息 存放 在 口令 文件 中 〈 见 图 6-1) ° 


6.4 组 


UNIX 组 文 件 〈《POSIX.1 称 其 为 组 数据 库 ) 包含 了 图 6-4 中 所 示 字 
段 。 这 些 字段 包含 在 <grp.h> 中 所 定义 的 group 结 构 中 。 


说 明 struct group 成 员 POSIX.1 | FreeBSD 8.0 | Linux 3.2.0 We Solaris 10 


组 名 char *gr name 
加 密 口 令 char *gr passwd 
数值 组 ID int gr gid 
指向 各 用 户 名 

指针 的 数组 ”| Char 。” 9r-men 


图 6-4 /etc/group 文 件 中 的 字段 

字段 gr_mem 是 一 个 指针 数组 ， 其 中 每 个 指针 指 回 一 个 属于 该 组 的 
用 户 名 。 该 数组 以 null 指 针 结 尾 。 可 以 用 下 列 两 个 由 POSIX.1 定 义 的 画 
数 来 查看 组 名 或 数值 组 ID © 

#include <grp.h> 


struct group *getgrgid(gid_t gid); 
struct group *getgrnam(const char *name); 
两 个 函数 返回 值 : ERD, RE; 知 出 错 ， 返 回 NULL 
如 同 对 口令 文件 进行 操作 的 函数 一 样 ， 这 两 个 畏 数 通 种 也 返回 指 
问 一 个 静态 变量 的 指针 ， 在 每 次 调用 时 都 重 写 该 静态 变量 。 
如 果 需 要 搜索 整个 组 文件 ， 则 须 使 用 另外 几 个 函数 。 下 列 3 个 函数 
类 似 于 针对 口令 文件 的 3 个 函数 。 


#include <grp.h> 

struct group *getgrent(void); 

返回 值 : ERD, REFS: 者 出 错 或 到 达 文 件 尾 端 ， 返 回 NULL 

void setgrent(void); 

void endgrent(void); 

3X 3 ER BM AN ze d AR POSIX.1 bn HE BJ 2H BC db 2) ° Single UNIX 
Specification 的 XSI 扩 展 定 义 了 这 些 函 数 。 所 有 UNIX 系 统 都 提供 这 3 个 
ERR ° 

setgrent KHAT FEALE (如 若 它 尚 末 被 打开 ) FRE © getgrent 
PREM AACE Ie P— dusk, WEA ARTF, MIGETTIFE ° 
endgrent 函 数 关 闭 组 文件 。 


6.5 附属 组 ID 


在 UNIX 系 统 中 ， 对 组 的 使 用 已 经 做 了 些 更 改 。 在 V7 中 ， 每 个 用 户 
任何 时 候 都 只 属于 一 个 组 。 当 用 户 登 妙 时， 系统 束 按 口令 文件 记录 项 
中 的 数值 组 ID ， 赋 给 他 实际 组 ID。 可 以 在 任何 时 候 执 行 newgrp(1T) 以 更 
改组 ID。 如 果 newgrp 命 令 执行 成 功 〈 关 于 权限 规则 ， 请 参阅 手册 ) ， 
则 实际 组 ID 就 更 改 为 新 的 组 ID ， 它 将 被 用 于 后 续 的 文件 访问 权限 检 
查 。 执 行 不 带 任何 参数 的 newgrp， 则 可 返回 到 原来 的 组 。 

这 种 组 成 员 形 式 一 直 维 持 到 1983 年 左右 。 此 时 ，4.2BSD 引 入 了 附 
属 组 ID (supplementary group ID) 的 概念 。 我 们 不 仅 可 以 属于 口令 文件 
记录 项 中 组 ID 所 对 应 的 组 ， 也 可 属于 多 至 16 个 另外 的 组 。 文 件 访问 权 
限 检查 相应 被 修改 为 : 不 仅 将 进程 的 有 效 组 ID 与 文件 的 组 ID 相 比 较 ， 
而 且 也 将 所 有 附属 组 ID 与 文件 的 组 ID 进行 比较 。 


附属 组 ID 是 POSIX.1 要 求 的 特性 。 (在 较 早 的 POSIX.1 版 本 中 ， 
该 特性 是 可 选 的 。) 常量 NGROUPS_MAX ( 见 图 2-11) 规定 了 附属 组 
ID 的 数量 ， 其 常用 值 是 16 〈 见 图 2-15) 。 

使 用 附属 组 ID 的 优点 是 不 必 再 显 式 地 经 常 更 改组 。 一 个 用 户 会 参 
与 多 个 项 目 ， 因 此 也 就 要 同时 属于 多 个 组 ， 此 类 情况 是 常 有 的 。 

为 了 获取 和 设置 附属 组 ID， 提 供 了 下 列 3 个 函数 。 


#include <unistd.h> 


N 


int getgroups(int gidsetsize, gid t grouplist[]); 
返回 值 : Aa, 3kIBDESZHIDZAES 者 出 错 ， 返 回 -1 
#include <grp.h> /* on Linux */ 
#include <unistd.h> /* on FreeBSD, Mac OS X, and Solaris */ 
int setgroups(int ngroups, const gid_t grouplist[]); 
#include <grp.h> /* on Linux and Solaris */ 
#include <unistd.h> /* on FreeBSD and Mac OS X */ 
int initgroups(const char *username, gid_t basegid); 
两 个 函数 的 返回 值 : BT, GRIGIO; ita, e- 
在 这 3 个 函数 中 ，POSIX.1 只 说 明了 getgroups。 因 为 setgroups 和 
initgroups 是 特权 操作 ， 所 以 它们 并 非 POSIX.1 的 组 成 部 分 。 但 是 ， 本 书 
说 明 的 所 有 4 种 平台 都 文 持 这 3 个 函数 。 在 Mac OS X 10.6.8 中 basegid 
被 声明 为 int 类 型 。 
getgroups 将 进程 所 属 用 户 的 各 附属 组 ID 填写 到 数组 grouplist 中 ， 填 
写 入 该 数组 的 附属 组 ID 数 最 多 为 gidsetsize 个 。 实 际 填写 到 数组 中 的 附 
属 组 ID 数 由 函数 返回 。 
作为 一 种 特殊 情况 ， 如 若 gidsetsize 为 0， 则 画 数 只 返回 附属 组 ID 
数 ， 而 对 数组 grouplist 则 不 做 修改 。 (这 使 调用 者 可 以 确定 grouplist 数 
组 的 长 度 ， 以 便 进 行 分 配 。) 


setgroups 可 由 超级 用 户 调用 以 便 为 调用 进程 设置 附属 组 ID 表 。 
grouplist 是 组 ID 数组 ， 而 ngroups 说 明了 数组 中 的 元 素数 。ngroups 的 值 
不 能 大 于 NGROUPS_MAX ° 

通常 ， 只 有 initgroups 函 数 调用 setgroups ，initgroups 读 整个 组 文件 

(用 前 面 说 明 的 函数 getgrent、setgrent 和 endgrent) ， 然 后 对 username 确 

定 其 组 的 成 员 关 系 。 然 后 ， 它 调用 setgroups， 以 便 为 该 用 户 初始 化 附属 
组 ID 表 。 因 为 initgroups 要 调用 setgroups， 所 以 只 有 超级 用 户 才能 调用 
initgroups。 除 了 在 组 文件 中 找到 username 是 成 员 的 所 有 组 ， initgroups 
也 在 附属 组 ID 表 中 包括 了 basegid。basegid 是 username 在 口令 文件 中 的 
组 ID ° 

只 有 少数 几 个 程序 调用 initgroups， 例 如 login(1) 程 序 在 用 户 登 录 时 
Val AER BY © 


6.6 实现 区 别 


我 们 已 讨论 了 Linux 和 Solaris 支 持 的 阴影 口令 文件 。FreeBSD 和 Mac 
OS XxX 则 以 不 同方 式 存 储 加 密 口 令 字 。 图 6-5 总 结 了 本 书 涉及 的 4 种 平台 
如 何 存 储 用 户 和 组 信息 。 


信息 FreeBSD 8.0 Linux 3.2.0 gcc = Solaris 10 


+ 十 
账户 信息 /etc/passwd /etc/passwd 目录 服务 /etc/passwd 


加 密 口 令 /etc/master.passwd | /etc/shadow 目录 服务 /etc/shadow 
是 否 是 散 列 口 令 文件 ? | 是 否 否 否 


组 信息 /etc/group /etc/group 目录 服务 /etc/group 


图 6-5 账户 实现 的 区 别 


在 FreeBSD 中 ， 阴 有 影 口令 文件 是 /etc/master.passwd。 可 以 使 用 特殊 
命令 编辑 该 文件 ， 它 会 从 阴影 口令 文件 产生 /etc/passwd 的 一 个 副本 。 


BIR, thre ESE I BI AX © /etc/pwd.db = /etc/passwd H^] B 71] Bil 
本 ，/etc/spwd.db 是 /etc/master.passwd 的 散 列 版 本 。 这 些 为 大 型 安装 的 系 
统 提供 了 更 好 的 性 能 。 

但 是 ，Mac OS XX 只 在 单 用 户 模 式 下 使 用 /etc/passwd 
和 /etc/master.passwd (在 维护 系统 时 ， 单 用 户 模式 通常 意味 着 不 能 提供 
任何 系统 服务 ) 。 在 正常 运行 期 间 的 多 用 户 模式 ， 目 录 服 务 守 护 进程 
提供 对 用 户 和 组 账户 信息 的 访问 。 

虽然 Linux 和 Solaris 文 持 类 似 的 阴影 口令 接口 ， 但 两 者 之 间 存 在 某 
些 细微 的 差别 。 例 如 ， 图 6-3 中 所 示 的 整数 字段 在 Solaris 中 定义 为 int 类 
型 ， 而 在 Linux 中 则 定义 为 long int。 男 一 个 差别 是 账户 -不 活动 字段 : 
Solaris 将 其 定义 为 上 自用 户 上 次 登录 后 到 下 次 账户 目 动 失效 之 间 的 天 数 ， 
而 Linux 则 将 其 定义 为 达到 最 大 口令 年 龄 尚 余 天 数 。 

在 很 多 系统 中 ， 用 户 和 组 数据 库 是 用 网 络 信息 服务 (Network 
Information Service, NIS) 实现 的 。 这 使 管理 人 员 可 编辑 数据 库 的 主 副 
本 ， 然 后 将 它 目 动 分 发 到 组 织 中 的 所 有 服务 右上 。 客 户 端 系 统 联系 服 
务 絮 以 查看 用 户 和 组 的 有 关 信 息 。NIS+ 和 轻 量 级 目录 访问 协议 

(Lightweight Directory Access Protocol, LDAP) 提供 了 类 似 功能 。 很 
多 系统 通过 配置 文件 /etc/nsswitch.conf 控 制 用 于 管理 每 一 类 信息 的 方 


法 。 


6.7 其 他 数据 文件 


至 此 仪 讨论 了 两 个 系统 数据 文件 一 一 口令 文件 和 组 文件 。 在 日 常 
操作 中 ，UNIX 系 统 还 使 用 很 多 其 他 文件 。 例 如 ，BSD 网 络 软件 有 一 个 
记录 各 网 络 服务 器 所 提供 服务 的 数据 文件 Uetc/services) ， 有 一 个 记 
录 协 议 信 息 的 数据 文件 (/etc/protocols) ， 还 有 一 个 则 是 记录 网 络 信息 


的 数据 文件 (/etc/networks) ° AiE, Wit HORE CEA Be DTE 
与 上 述 对 口令 文件 和 组 文件 的 相似 。 
一 般 情 况 下 ， 对 于 每 个 数据 文件 至 少 有 3 个 函数 。 
(1) get 函 数 : 读 下 一 个 记录 ， 如 果 需 要 ， 还 会 打开 该 文件 。 此 种 
函数 通常 返回 指 回 一 个 结构 的 指针 。 当 已 达到 文件 尾 端 时 返回 空 指 
秆 。 大 多 数 get 函 数 返 回 指 癌 一 个 静态 存储 类 结构 的 指针 ， 如 果 要 保存 
其 内 容 ， 则 需 复 制 它 。 
(2) set 函数 : 打开 相应 数据 文件 〈 如 果 尚 未 打开 ) ， 然 后 反 绕 该 
文件 。 如 采 硕 望 在 相应 文件 起 始 处 开始 处 理 ， 则 调用 此 函数 。 
(3) end 函 数 : 关闭 相应 数据 文件 。 如 前 所 述 ， 在 结束 了 对 相应 
数据 文件 的 读 、 写 操作 后 ， 总 应 调用 此 函数 以 天 财 所 有 相关 文件 。 
另外 ， 如 采 数 据 文件 文 拧 某 种 形式 的 键 搜 索 ， 则 也 提供 搜索 具有 
站 定 键 的 记录 的 例 程 。 例 如 ， 对 于 口令 文件 ， 提 供 了 两 个 按键 进行 搜 
索 的 程序 : getpwnam 寻找 具有 指定 用 户 名 的 记录 ; getpwuid 寻 找 具 有 
指定 用 户 ID 的 记录 。 
图 6-6 中 列 出 了 一 些 这 样 的 例 程 ， 这 些 都 是 UNIX 常 用 的 。 在 图 中 列 
出 了 针对 口令 文件 和 组 文件 的 钞 数 ， 这 些 已 在 剖面 说 明 过 。 图 中 也 列 
出 了 一 些 与 网 络 有 天 的 玉 数 。 对 于 图 中 列 出 的 所 有 数据 文件 都 有 get、 
set 和 和 end 函数 。 


数据 文件 头 文件 结构 附加 的 键 搜索 函数 


/etc/passwd «pwd.h» passwd getpwnam. getpwuid 

/etc/group «grp.h» group getgrnam. getgrgid 

/etc/shadow <shadow.h> spwd getspnam 

/etc/hosts <netdb.h> hostent getnameinfo. getaddrinfo 
/etc/networks <netdb.h> netent getnetbyname, getnetbyaddr 
/etc/protocols <netdb.h> protoent Getprotobyname, getprotobynumber 


/etc/services <netdb.h> servent getservbyname. getservbyport 


图 6-6 访问 系统 数据 文件 的 一 些 例 程 


在 Solaris FP, Al 6-6 中 的 最 后 4 个 数据 文件 都 是 符号 链接 ， 它 们 
都 链接 到 目录 /etcinet 下 的 同名 文件 上 。 大 多 数 UNIX 系 统 实现 都 有 类 似 
于 多 中 所 列 的 附加 画 数 ， 但 是 这 些 附 加 画 数 都 旧 在 处 理 系统 管理 文 
Fe SHTETE 


6.8 登录 账户 记录 


大 多 数 UNIX 系 统 都 提供 下 列 两 个 数据 文件 ，utmp 文 件 记 杂 当 前 登 
杂 到 系统 的 各 个 用 户 ; wtmp 文 件 跟踪 各 个 登录 和 注销 事件 。 在 V7 中 ， 
每 次 写 入 这 两 个 文件 中 的 是 包含 下 列 结构 的 一 个 二 进 制 记录 : 
struct utmp { 
char ut line[8]; /* tty line: "ttyhO", "ttydO", "ttypO", ... */ 


char ut. name[8]; /* login name */ 

long ut time; /* seconds since Epoch */ 
H 
登录 时 ，login 程序 填写 此 类 型 结构 ， 然 后 将 其 写 入 到 utmp 文件 
中 ， 同 时 也 将 其 闫 写 到 wtmp 文 件 中 。 注 销 时 ，init 进 程 将 utmp 文 件 中 相 
应 的 记录 擦 除 〈 每 个 字 节 都 填 以 null 字 节 ) ， 并 将 一 个 新 记录 添 写 到 
wtmp 文 件 中 。 在 wtmp 文 件 的 注销 记录 中 ，ut_name 字 上 段 清 除 为 0。 ER 
统 再 启动 时 ， 以 及 更 改 系统 时 间 和 日 期 的 前 后 ， 都 在 wtmp 文 件 中 追加 
写 特殊 的 记录 项 。who(1) 程 序 读 取 utmp 文 件 ， 并 以 可 读 格 式 打印 其 内 
容 。 后 来 的 UNIX 版 本 提供 last(1) 命 令 ， 它 读 wtmp 文 件 并 打印 所 选择 的 
iK. 

大 多 数 UNIX 版 本 仍 提供 utmp 和 wtmp 文 件 ， 但 正如 所 期 望 的 ， 其 中 

的 信息 量 却 增加 了 。V7 中 写 入 的 20 字 节 的 结构 在 SVR2 中 已 扩充 为 36 字 
节 ， 而 在 SVR4 中 ，utmp 结 构 已 扩充 为 多 于 350 字 节 。 


在 Solaris 中 ， 这 些 记录 的 详细 格式 请 参见 手册 页 utmpx(4) ° Solaris 
10 中 这 两 个 文件 都 在 目录 /var/adm 中 。 solaris 提供 了 很 多 函数 (UL 
getutx(3)) 读 或 写 这 两 个 文件 。 

TE FreeBSD 8.0 和 Linux 3.2.0 中 ， 登 录 记 录 的 格式 请 参见 手册 页 
utmp(5)。 这 两 个 文件 的 路 径 名 是 /varvrun/utmp 和 /varvlog/wtmp“。 在 Mac 
OS X 10.6.8 中 ，utmp 和 wtmp 文 件 不 存在 。 在 Mac OS X 10.5 中 wtmp 
文件 中 的 信息 可 以 从 系统 登录 工具 中 获得 ，utmpx 文 件 包 含 了 活动 的 登 

会 话 的 信息 。 


6.9 系统 标识 


POSIX.15E Y. f uname EN Zt, "E 3k [n] Ej SE HURUBRTE 3s ZU 2X BI 


GI 
[9] 


#include <sys/utsname.h> 
int uname(struct utsname *name); 
返回 值 ， 硕 成功， 返回 非 负 值 ， 奉 出 错 ， 返 回 -1 
通过 该 函数 的 参数 向 其 传递 一 个 utsname 结构 的 地 址 ， 然 后 该 函数 
填写 此 结构 。POSIX.1 只 定义 了 该 结构 中 最 少 需 提供 的 字段 (它们 都 是 
字符 数组 ) ， 而 每 个 数组 的 长 度 则 由 实现 确定 。 某 些 实现 在 该 结构 中 
fe Gt T 0) EF ES o 


struct utsname { 


char sysname[ ]; /* name of the operating system */ 
char nodename| ]; /* name of this node */ 

char release[ |; /* current release of operating system */ 
char version[ |; /* current version of this release */ 


char machine[ |; /* name of hardware type */ 


); 

fi^ TERT FB Ab DA null = AE 9 ABE ES LENEA 
SKE (包含 终止 null 字 节 ) 列 于 图 6-7 中 。utsname 结 构 中 的 信息 通常 
可 用 uname(1) 命 令 打印 。 

POSIX.1 警 告 nodename 元 素 可 能 并 不 适用 于 在 通信 网 络 上 引用 主 
机 “。 此 函数 来 和 目 于 System V， 在 早期 ，nodename 元 系 适 用 于 在 UUCP 网 
络 上 引用 主机 。 

还 要 认识 到 ， 在 此 结构 中 并 没有 给 出 有 关 POSIX.1 版 本 的 信息 。 应 
当 使 用 2.6 节 中 所 说 明 的 _POSIX_VERSION 获 得 该 信息 。 

最 后 ， 此 函数 只 给 出 了 一 种 获取 该 结构 中 信息 的 方法 ， 至 于 如 何 
初始 化 这 些 信息 ，POSIX.1 没 有 给 出 任何 说 明 。 

历史 上 ，BSD 派 生 的 系统 提供 gethostname 函 数 ， 它 只 返回 主机 
名 ， 该 名 字 通 常 就 是 TCP/IP 网 络 上 主机 的 名 字 。 


#include <unistd.h> 


int gethostname(char *name, i n t namelen); 
返回 值 : AB, wo; Auta, we- 
namelen 参 数 指 定 name 绥 冲 区 长 度 ， 如 若 提 供 足 够 的 空间 ， 则 通过 
name 返 回 的 字符 串 以 null 子 广 结 尾 。 如 大 没有 提供 足够 的 空间 ， 则 没有 
说 明 通 过 name 返 回 的 字符 串 是 否 以 null 结 尾 。 
现在 ，gethosthame 范 数 已 在 POSIX.1 中 定义 ， 它 指定 最 大 主机 名 长 
度 是 HOST_NAME_MAX。 图 6-7 中 总 结 列 出 了 本 书 讨 论 的 4 种 实现 支持 
的 最 大 名 字 长 度 。 


最 大 名 字 长 度 


uname 256 65 256 257 
gethostname 256 64 256 256 


图 6-7 系统 标识 名 限制 


AUR TE EWR EIT CPP P28 rn, WU dS LA BERE EY ELA SE 
整 域名 。 

hostname(1) 命 令 可 用 来 获取 和 设置 主机 名 。 (超级 用 户 用 一 个 类 
似 的 函数 sethostname 来 设置 主机 名 。) 主机 名 通常 在 系统 自 举 时 设 
置 ， 它 由 /etc/rc 或 init 取 自 一 个 启动 文件 。 


6.10 时 间 和 日 Es 


由 UNIX 内 核 提 供 的 基本 时 间 服 务 是 计算 目 协调 世界 时 
(Coordinated Universal Time, UTC) 公元 1970 年 1 月 1 日 00:00:00 这 一 
特定 时 间 以 来 经 过 的 秒 数 。1.10 节 中 曾 提 及 这 种 秒 数 是 以 数据 类 型 
time_t 表 示 的 ， 我 们 称 它们 为 日 历时 间 。 日 历时 间 包 括 时 间 和 日 期 。 
UNIX 在 这 方面 与 其 他 操作 系统 的 区 别 是 : a) 以 协调 统一 时 间 而 非 
本 地 时 间 计 时 ; (b) 可 自动 进行 转换 ， 如 变换 到 夏令 时 ; (c) 将 时 
间 和 日 期 作为 一 个 量 值 保 存 。 
time E255 E] 5 Bi] ERE H E o 


include <time.h> 


time t time(time t *calptr); 
返回 值 ， 若 成 功 ， 返 回 时 间 值 ， 若 出 错 ， 返 回 -1 
时 间 值 作为 函数 值 返回 。 如 果 参 数 非 空 ， 则 时 间 值 也 存放 在 由 
calptr 指 同 的 单元 内 。 
POSXI.1 的 实时 扩展 增加 了 对 多 个 系统 时 钟 的 文 持 。 在 Single 
UNIX Specification V4 中 ， 控 制 这 些 时 钟 的 接口 从 可 选 组 被 移 至 基本 
组 。 时 钟 通过 clockid_t 类 型 进行 标识 。 图 6-8 给 出 了 标准 值 。 


LOCK REALTIME 实时 系统 时 间 


LOCK MONOTONIC POSIX MONOTONIC CLOCK 不 带 负 跳 数 的 实时 系统 时 间 
LOCK PROCESS CPUTIME ID POSIX CPUTIME 调用 进程 的 CPU 时 间 
LOCK THREAD CPUTIME ID POSIX THREAD CPUTIME 调用 线程 的 CPU 时 间 


图 6-8 时 钟 类 型 标识 符 
clock_gettime 函 数 可 用 于 获取 指定 时 钟 的 时 间 ， 返 回 的 时 间 在 4.2 
节 介 绍 的 timespec 结 构 中 ， 它 把 时 间 表 示 为 秒 和 纳 秒 。 


#include <sys/time.h> 


int clock gettime(clockid t clock. id, struct timespec *tsp); 
返回 值 : 者 成 功 ， 返 回 0; AE, we- 
当时 钟 ID 设置 为 CLOCK_REALTIME 时 ，clock_gettime 画 数 提 供 了 
与 time 芳 数 类 似 的 功能 ， 不 过 在 系统 支持 高 精度 时 间 值 的 情况 下 ， 
clock_gettime 可 能 比 time 函 数 得 到 更 高 精度 的 时 间 值 。 


#include <sys/time.h> 


int clock getres(clockid t clock. id, struct timespec *tsp); 
返回 值 : 者 成 功 ， 返 回 0; AE, wel- 
clock_getres 函 数 把 参数 tsp 指 癌 的 timespec 结 构 初 始 化 为 与 clock id 
参数 对 应 的 时 钟 精度 。 例 如 ， 如 果 精 度 为 1 毫秒 ， 则 tv_sec 字 段 束 是 0， 
tv_nsec=# Exivize1 000 000 ° 
要 对 特定 的 时 钟 设置 时 间 ， 可 以 调用 clock_settime 芳 数 。 


#include <sys/time.h> 


int clock settime(clockid t clock id, const struct timespec *tsp); 
返回 值 : 者 成 功 ， 返 回 0; 看 出 错 ， 返 回 -1 
我 们 需要 适当 的 特权 来 更 改 时 钟 值 ， 但 是 有 些 时 钟 是 不 能 修改 
的 。 


历史 上 ， 在 System VIKRAM AZAR, MH stime) ER Z2 1x E 
系统 时 间 ， 而 在 BSD 派 生 的 系统 中 调用 settimeofday(2) 设 置 系统 时 间 » 
SUSv4 指 定 gettimeofday 函 数 现在 已 弃 用 。 然 而 ， 一 些 程序 仍然 使 
用 这 个 函数 ， 因 为 与 time 本 数 相 比 ，gettimeofday 提 供 了 更 高 的 精度 
(可 到 微 秒 级 ) ° 


#include <sys/time.h> 


int gettimeofday(struct timeval *restrict tp, void *restrict tzp); 
返回 值 : 总 是 返回 0 

tzp 的 唯一 合法 值 症 NULL， 其 他 值 将 产生 不 确定 的 结果 。 某 些 平 
台 文 持 用 tzp 说 明 时 区 ， 但 这 完全 依 实现 而 定 ，Single UNIX 
Specification 对 此 并 没有 定义 。 

gettimeofday 函 数 以 距 特定 时 间 (1970 年 1 月 1 日 00 : 00:00) 的 秒 数 
的 方式 将 当前 时 间 存 放 在 tp 指向 的 timeval 结 构 中 ， 而 该 结构 将 当前 时 间 
表示 为 秒 和 微 秒 。 

一 旦 取得 这 种 从 上 述 特定 时 间 经 过 的 秒 数 的 整 型 时 间 值 后 ， 通 常 
要 调用 函数 将 其 转换 为 分 解 的 时 间 结 构 ， 然 后 调用 另 一 个 函数 生成 人 
们 可 读 的 时 间 和 日 期 。 图 6-9 说 明了 各 种 时 间 函 数 之 间 的 关系 。 (图 中 
以 虚线 表示 的 3 个 函数 localtime、mktime 和 strftime 都 受到 环境 变量 TZ 的 
影响 ， 我 们 将 在 本 下 的 最 后 部 分 对 其 进行 说 明 。 点 划 线 表示 了 如 何 从 
时 间 相 关 的 结构 获得 日 历时 间 。 ) 

两 个 函数 localtime 和 gmtime 将 日 历时 间 转 换 成 分 解 的 时 间 ， 并 将 这 
些 存放 在 一 个 tm 结构 中 。 


struct tm { /* a broken-down time */ 
int tm_sec; /* seconds after the minute: [0 - 60] */ 
int tm min; /* minutes after the hour: [0 - 59] */ 
int tm hour; /* hours after midnight: [0 - 23] */ 


int tm mday; /* day of the month: [1 - 31] */ 


int 
int 
int 
int 
int 


le 


tm_mon; 
tm_year; 
tm_wday; 
tm_yday; 


tm_isdst; 


/* months since January: [0 - 11] */ 
/* years since 1900 */ 
/* days since Sunday: [0 - 6] */ 
/* days since January 1: [0 - 365] */ 
/* daylight saving time flag: «0, 0, >0 */ 


秒 可 以 超过 59 的 理由 是 可 以 表示 润 秒 。 注 意 ， 除 了 月 日 字段 ， 其 
他 了 字段 的 值 都 以 0 开始 。 如 末 夏 令 时 生效 ， 则 夏令 时 标志 值 为 正 ， 如 琳 


为 非 夏令 时 时 间 ， 则 该 标志 值 为 0 如 果 此 信息 不 可 用 ， 则 其 值 为 负 。 
Single UNIX Specification 的 以 前 版 本 允许 双 润 秒 ， 于 是 ，tm_sec 值 

的 有 效 范 围 是 0 一 61。 
UTC 的 正式 定义 不 允许 双 润 秒 ， 所 以 ， 现 在 tm_sec 值 的 有 效 范 围 定 

义 为 0~60。191 


格式 化 字符 串 


struct tm 


( 分 解 时 间 ) 


gmtime 
localtime 


time t 


tv sec (日 历时 间 ) tv sec 


timeval timespec 


gettimeofday time clock gettime 


内 核 
图 6-9 各 个 时 间 画 数 之 间 的 关系 


#include <time.h> 

struct tm *gmtime(const time t *calptr); 

struct tm *localtime(const time t *calptr); 

两 个 函数 的 返回 值 : 指向 分 解 的 tm 结构 的 指针 ; 若 出 错 ， 返 回 NULL 

localtime 和 gmtime 之 间 的 区 别 是 : localtime 将 日 历时 间 转 换 成 本 地 
时 间 〈 考 虑 到 本 地 时 区 和 夏令 时 标志 ) ， 而 gmtime 则 将 日 历时 间 转 换 
成 协调 统一 时 间 的 年 、 月 、 日 、 时 、 分 、 秒 、 周 日 分 解 结构 。 

玫 数 mktime 以 本 地 时 间 的 年 、 月 、 日 等 作为 参数 ， 将 其 变换 成 


time t 值 S 


#include <time.h> 
time_t mktime(struct tm *tmptr); 
返回 值 : ERD, RIA il; 大 出 错 ， 返 回 -1 
函数 strftime 是 一 个 类 似 于 printf 的 时 间 值 函数 。 它 非常 复杂 ， 可 以 
通过 可 用 的 多 个 参数 来 定制 产生 的 字符 串 。 
#include <time.h> 
size_t strftime(char *restrict buf, size_t maxsize, 
const char *restrict format, 
const struct tm *restrict tmptr); 
size tstrftime l(char *restrict buf, size t maxsize, 
const char *restrict format, 
const struct tm *restrict tmptr, locale t locale); 
两 个 函数 的 返回 值 : FAZE, KEFARET APM, eo 
两 个 较 早 的 函数 一 一 asctime 和 ctime 能 用 于 产生 一 个 26 字 节 的 可 打 
印 的 字符 串 ， 类 似 于 date(J) 命 令 默 认 的 输出 。 然 而 ， 这 些 函 数 现在 已 经 
被 标记 为 弃 用 ， 因 为 它们 易 受 到 缓冲 区 淤 出 问题 的 影响 。 
strftime 1 允许 调用 者 将 区 域 指定 为 参数 ， 除 此 之 外 ，strftime 和 
strftime_1 夯 数 是 相同 的 。strftime 使 用 通过 TZ 环境 变量 指定 的 区 域 。 
tmptr 参 数 是 要 格式 化 的 时 间 值 ， 由 一 个 指 同 分 解 时 间 值 im 结构 的 
指针 说 明 。 格 式 化 结果 存放 在 一 个 长 度 为 maxsize 个 字符 的 buf 数 组 中 ， 
如 果 buf 长 度 足 以 存放 格式 化 结果 及 一 个 null 终 止 符 ， 则 该 函数 返回 在 
buf 中 存放 的 字符 数 (不 包括 null 终 止 符 ) ; 否则 该 函数 返回 0。 
format 参 数控 制 时 间 值 的 格式 。 如 同 printf 函 数 一 样 ， 转 换 说 明 的 
形式 是 百 分 号 之 后 跟 一 个 特定 字符 。format 中 的 其 他 字符 则 按 原 样 输 
出 。 两 个 连续 的 百 分 号 在 输出 中 产生 一 个 百 分 号 。 与 printf 函 数 的 不 同 
之 处 是 ， 每 个 转换 说 明 产 生 一 个 不 同 的 定 长 输出 字符 串 ， 在 format 字 符 


串 中 没有 字段 宽度 修饰 符 。 图 6-10 中 列 出 了 37 种 ISO C 规 定 的 转换 说 
BH 。 


£y 


缩写 的 周 日 名 Thu 

全 周 日 名 Thursday 
缩写 的 月 名 Jan 

全 月 名 January 
日 期 和 时 间 Thu Jan 19 21:24:52 2012 
年 /100 (00— 99) 20 

月 日 (01 一 31) 19 

日 期 (MM/DD/YY) 01/19/12 
月 日 〈 一 位 数字 前 加 空格 ) (1 一 31) 19 

ISO 8601 日 期 格式 CYYYY-MM-DD) 2012-01-19 
ISO 8601 基于 周 的 年 的 最 后 2 位 数 (00 一 99) 12 

ISO 8601 基于 周 的 年 2012 
与 $b 相同 Jan 

小 时 〈24 小 时 制 )〈00 一 23 ) 21 

小 时 (12 小 时 制 ) (01 一 12) 09 

年 日 001 一 366 ) 019 

A K01—12) 01 

4j (00—59) 24 

TRATTE 

AM/PM PM 

本 地 时 间 C12 小 时 制 》 09:24:52 PM 
与 “%H:%M” 相 同 21:24 

f». [00-60] 52 
水 平 制 表 符 

与 “s$H:SsSM:SsS” 相 同 21:24:52 
ISO 8601 Jal JL (Monday=1, 1 一 7) 

星期 日 周 数 : 〈00 一 53 ) 

ISO 8601 周 数 〈01 一 53 ) 

Jal JL: CO-Sunday, 0 一 6) 

星期 一 周 数 : (00—53) 03 

本 地 日 期 01/19/12 
本 地 时 间 21:24:52 
年 的 最 后 两 位 数字 (00—99) 12 

年 2012 

ISO 8601 格式 的 UTC 偏 移 量 -0500 

时 区 名 EST 
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图 6-10 strftime 的 转换 说 明 


图 中 第 3 列 的 数据 来 自 于 在 Mac OS XP AAT strftime ES AU PT AG 
果 ， 它 对 应 的 时 间 和 日 期 是 : Thu Jan 19 21:24:52 EST 2012。 

图 6-10 中 的 大 多 数 格 式 说 明 的 意义 很 明显 。 需 要 略 做 解释 的 
是 %U、%V 和 %W。%U 是 相应 日 期 在 该 年 中 所 属 周 数 ， 包 含 该 年 中 第 
一 个 星期 日 的 周 是 第 一 周 。%W 也 是 相应 日 期 在 该 年 中 所 属 的 周 数 ， 
不 同 的 是 包含 第 一 个 星期 一 的 周 为 第 一 周 。%V 说 明 符 则 与 上 述 两 者 有 
较 大 区 别 。 如 果 包 仿 了 1 月 1 日 的 那 一 周 包含 了 新 一 年 的 4 天 或 更 多 天 ， 
那么 该 周 是 一 年 中 的 第 一 周 ， 否 则 该 周 补 认为 是 上 一 年 的 最 后 一 周 。 
在 这 两 种 情况 下 ， 周 一 都 被 视 作 每 周 的 第 一 天 。 

同 printf 一 样 ，strftime 对 某 些 转换 说 明 支 持 修饰 他。 可 以 使 用 E 和 O 
修饰 符 产 生 本 地 支持 的 男 一 种 格式 。 

某 些 系 统 对 strftime 的 format 字 人 符 串 提供 男 一 些 非 标 准 的 扩充 文 持 。 

实例 

图 6-11 演 示 了 如 何 使 用 本 章 中 讨论 的 多 个 时 间 函 数 。 特 别 演示 了 如 
何 使 用 strftime 打 印 包含 当前 日 期 和 时 间 的 字符 串 。 


#include <stdio.h> 
#include <stdlib.h> 
#include <time.h> 


int 

main (void) 

{ 
time_t t; 
struct tm *tmp; 
char buf1[16]; 
char buf2[64]; 


time (&t) ; 

tmp = localtime (&t); 

if (strftime(bufl, 16, "time and date: $r, $a $b %d, SY", tmp) == 0) 
printf("buffer length 16 is too small\n"); 

else 
printf("$sVin", bufl); 

if (strftime(buf2, 64, "time and date: $r, $a $b $d, SY", tmp) == 0) 


printf("buffer length 64 is too small\n"); 
else 

printf("£sMn", buf2); 
exit(0); 


图 6-11 使 用 strftime 函 数 

回顾 图 6-9 中 的 不 同时 间 画 数 的 关系 。 在 以 人 们 可 读 的 格式 打印 时 
间 之 前 ， 需 要 获取 时 间 并 将 其 转换 成 分 解 的 时 间 结构 。 图 6-11 程 序 的 输 
出 如 下 : 


$ ./a.out 


buffer length 16 is too Small 

time and date: 11:12:35 PM, Thu Jan 19, 2012 

strptime 函 数 是 strftime 的 反 过 来 版 本 ， 把 字符 串 时 间 转 换 成 分 解 时 
间 。 

#include <time.h> 

char *strptime(const char *restrict buf, const char *restrict format, 


struct tm *restrict tmptr); 


返回 值 : 指 癌 上 次 解 术 的 字符 的 下 一 个 字符 的 指针 否则， 返回 NULL 


format 参 数 给 出 了 buf 参 数 指 同 的 缓冲 区 内 的 字符 串 的 格式 。 虽 然 
与 strftime 函 数 的 说 明 稍 有 不 同 ， 但 格式 说 明 是 类 似 的 。strptime 函 数 转 
换 说 明 符 列 在 图 6-12 中 。 
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缩写 的 或 完整 的 周 日 名 
与 $a 相同 

缩写 的 或 完整 的 月 名 

与 sb 相同 

日 期 和 时 间 

年 的 最 后 两 位 数字 

HH: [01-31] 

日 期 [MM/DD/YY] 

与 $d 相同 

与 sb 相同 

小 时 (24 小 时 制 ): [00-23] 
小 时 〈12 小 时 制 ): [01-12] 
年 日 : [001-366] 

H: [01-12] 

4|: [00-59] 

任何 空白 

AM/PM 

本 地 时 间 : C12 小 时 制 ) 

与 “%H:%M” 相 同 

秒 : [00-60] 

任何 空白 

与 “%H:%M:%$S” 相 同 
星期 日 周 数 : [00-53] 

周 日 : [0=Sunday, 0-6] 
星期 一 周 数 : [00-53] 

本 地 日 期 

本 地 时 间 

年 的 最 后 两 位 数字 : [00-99] 
年 
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图 6-12 strptime ER XT) ctf VE HE] 

我 们 曾 在 前 面 提 及 ， 图 6-9 中 以 虚线 表示 的 3 个 函数 受到 环境 变量 
TZ 的 影响 。 这 3 个 函数 是 localtime、mktime 和 strftime。 如 果 定 义 了 TZ， 
则 这 些 画 数 将 使 用 其 值 代替 系统 默认 时 区 。 如 果 TZ 定义 为 空 串 (B 
TZ-) ， 则 使 用 协调 统一 时 间 UTC。TZ 的 值 常 常 类 似 于 
TZ=EST5EDT， 但 十 POSIX.1 允许 更 详细 的 说 明 。 有 关 TZ 变量 的 详细 
情况 ， 请 参阅 Single UNIX Specification [Open Group 2010] 中 的 环境 变 
RE 

天 于 TZ 环境 变量 的 更 多 信息 可 参见 手册 页 tzset(3)。 


6.11 小 结 


所 有 UNIX 系 统 都 使 用 口令 文件 和 组 文件 。 我 们 说 明了 读 这 些 文 件 
的 各 种 函数 。 本 章 也 介绍 了 阴影 口令 ， 它 可 以 增加 系统 的 安全 性 。 附 
属 组 ID 提供 了 一 个 用 户 同时 可 以 参加 多 个 组 的 方法 。 我 们 还 介绍 了 大 
多 数 系统 所 提供 的 访问 其 他 与 系统 有 关 数 据 文件 的 类 似 函 数 。 我 们 讨 
论 了 几 个 POSIX.1 的 系统 标识 函数 ， 应 用 程序 使 用 它们 以 标识 它 在 何 种 
系统 上 运行 。 最 后 ， 说 明了 ISO C 和 Single UNIX Specification 提 供 的 与 
时 间 和 日 期 有 关 的 一 些 函 数 。 


习题 


6.1 如 采 系 统 使 用 阴影 文件 ， 那 么 如 何 取得 加 密 口 令 ? 
6.2 假设 你 有 超级 用 户 权 限 ， 并 且 系 统 使 用 了 阴影 口令 ， 重 新 考虑 
上 一 道 习题 。 


6.3 编写 一 程序 ， 它 调用 uname 并 输出 utsname 结 构 中 的 所 有 字段 ， 
将 该 输出 与 name(1) 命 令 的 输出 结果 进行 比较 。 

6.4 计算 可 由 time t 数 据 类 型 表示 的 最 近 时 间 。 如 采 超 出 了 这 一 时 
间 将 会 如 何 ? 

6.5 编写 一 程序 ， 获 取 当 前 时 间 ， 并 使 用 strftime 将 输出 结果 转换 
为 类 似 于 date(1) 命 令 的 默认 输出 。 将 环境 变量 TZ 设置 为 不 同 值 ， 观 察 
输出 结果 。 


下 一 章 将 介绍 进程 控制 原 语 ， 在 此 之 前 需 先 了 解 进程 的 环境 。 本 
章 中 将 学 习 : 当 程 序 执行 时 ， 其 main 函 数 是 如 何 被 调用 的 ; 命令 行 参 
数 是 如 何 传 递 给 新 程序 的 ， 上 典型 的 存储 空间 布局 是 什么 样式 ;如 何 分 
配 男 外 的 存储 空间 ; 进程 如 何 使 用 环境 变量 ;进程 的 各 种 不 同 终止 方 
式 等 。 另 外 ， 还 将 说 明 longjmp 和 setjimp 画 数 以 及 它们 与 栈 的 交互 作 
用 。 本 章 结束 之 前 ， 还 将 查看 进程 的 资源 限制 。 


Fi main 国 数 


C 程 序 总 是 从 main 函 数 开 始 执行 。main 函 数 的 原型 是 : 

int main(int argc, char *argv[]); 

其 中 ，argc 是 命令 行 参 数 的 数目 ，argv 是 指向 参数 的 各 个 指针 所 构 
成 的 数组 。7.4 节 将 对 命令 行 参 数 进行 说 明 。 

当 内 核 执 行 C 程 序 时 CER] — Dexe Kit, 8.107 D FEL BH exec ER 
数 ) ， 在 调用 main 前 先 调 用 一 个 特殊 的 启动 例 程 。 可 执行 程序 文件 将 
此 启动 例 程 指定 为 程序 的 起 始 地 址 一 一 这 是 由 连接 编辑 器 设置 的 ， 而 
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变量 值 ， 然 后 为 按 上 述 方 式 调用 main 函 数 做 好 安排 。 


有 8 种 方式 使 进程 终止 (termination) ， 其 中 5 种 为 正常 终止 ， 它 们 
(1) 从 main 返 回 ; 
(2) ee 
(3) 调用 _exit 或 _Exit; 
mne US IUSSI 
(5) 从 最 后 一 个 线程 调用 pthread_exit (11.577) 。 
异常 终止 有 3 种 方式 ， 它 们 是 : 
( 
( 


im 


6) 调用 abort (10.179) ; 
7) 接 到 一 个 信号 (10.275) ; 

(8) 最 后 一 个 线程 对 取消 请 求 做 出 响应 〈11.5 节 和 12.7 节 ) 。 

在 第 11 章 和 第 12 章 讨论 线程 之 前 ， 我 们 暂 不 考虑 专门 针对 线程 的 3 
种 终止 方式 。 

上 和 节 提 及 的 局 动 例 程 是 这 样 编写 的 ， 使 得 从 main 返 回 后 立即 调用 
exit 函 数 。 如 采 将 局 动 例 程 以 C 代 码 形式 表示 (SEI Ei BRE Ss AIL 
编 语言 编写 ) ， 则 它 调 用 main 函 数 的 形式 可 能 是 : 

exit(main(argc, argv)); 

1. 退出 函数 

3 个 函数 用 于 正常 终止 一 个 程序 ，_exit 和 _Exit 立 即 进入 内 核 ，exit 
则 先 执行 一 些 清理 处 理 ， 然 后 返回 内 核 。 

#include <stdlib.h> 


void exit(int status); 


void _Exit(int status); 

#include <unistd.h> 

void _exit(int status); 

Ba -REtES.5 T PIERI T BOT EERE (如 正在 终止 进程 的 父 
进程 和 子 进程 ) 的 影响 。 

使 用 不 同 头 文件 的 原因 是 exit 和 _Exit 是 由 ISO C 说 明 的 ， 而 _exit 是 
由 POSIX.1 说 明 的 。 

由 于 历史 原因 ，exit 函数 总 是 执行 一 个 标准 VO 库 的 清理 关闭 操 
fg: 对 于 所 有 打开 流 调用 fclose 函 数 。 回 忆 5.5 站 ， 这 造成 答 出 缓冲 中 的 
所 有 数据 都 被 冲洗 ( 写 到 文件 上 ) 

3 个 退出 函数 都 带 一 个 整 型 参数 ， 称 为 终止 状态 (或 退出 状态 ， 
exit status) 。 大 多 数 UNIX 系 统 shell 都 提供 检查 进程 终止 状态 的 方法 。 
如 果 (a) 调用 这 些 函 数 时 不 带 终 止 状态 ， 或 (b) main 执 行 了 一 个 无 
返回 值 的 retum 语 句 ， 或 (c) main 没 有 声明 返回 类 型 为 整 型 ， 则 该 进程 
的 终止 状态 是 未 定义 的 。 但 是 ， 若 main 的 返回 类 型 是 整 型 ， 并 且 main 
执行 到 最 后 一 条 语句 时 返回 ( 隐 式 返回 ) ， 那 么 该 进程 的 终止 状态 是 
0 o 

这 种 处 理 是 ISO C 标 准 1999 版 引入 的 。 历 史上 ， 者 main 函 数 终止 时 
没有 显 式 使 用 return 语 句 或 调用 exit 函 数 ， 那 么 进程 终止 状态 是 未 定义 
的 。 

main 函 数 返 回 一 个 整 型 值 扎 用 该 值 调 用 exit 是 等 价 的 。 于 是 在 main 
函数 中 

exit(0); 

等 价 于 

return(0); 

实例 

图 7-1 中 的 程序 是 经 典 的 “hello, world” 实 例 。 


#include <stdio.h> 
main () 
{ 
printf("hello; world\n"); 
} 


对 该 程序 进行 编译 ， 


图 7-1 经 典 C 程 序 


然后 运行 ， 则 可 见 到 其 终止 码 是 随机 的 。 如 


果 在 不 同 的 系统 上 编译 该 程序 ， 我 们 很 可 能 得 到 不 同 的 终止 码 ， 这 取 
决 于 main 函 数 返 回 时 栈 和 寄存 万 的 内 容 : 


$ gcc hello.c 
$ ./a.out 
hello, world 
$ echo $? 
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打印 终止 状态 


现在 ， 我 们 局 用 1999 ISO C 编 译 僻 扩展 ， 则 可 见 到 终止 码 改 变 了 : 


$ gcc -std=c99 hello.c 


$ echo $? 


启用 gcc 的 1999 ISO CH E 
打印 终止 状态 


hello.c:4: warning: return type defaults to 'int' 


$ ./a.out 
hello, world 
0 


注意 ， 当 我 们 启用 1999 ISO C 扩 展 时 ， 编 译 器 发 出 警告 消息 。 打 印 
该 警告 消息 的 原因 是 : mains ZR BUS AP ISUR o zt jS BIDS SEE o Bn 
dif RE Tk, PBA HB USA NM o (Hoe, WURST 
使 编译 器 所 推荐 的 警告 消息 都 起 作用 (使 用 -Wall 标 志 ) ， 则 可 能 见 到 


类 似 于 “control reaches end of nonvoid function.” ( 欣 制 到 达 非 void 函数 的 


Em) 这 样 的 警告 消息 。 


将 main 声 明 为 返回 整 型 ， 但 在 main 函 数 体内 用 exit 代 赫 return ， 对 
某 些 C 编 译 器 和 UNIX lint(1) 程 序 而 言 会 产生 不 必要 的 警告 信息 ， 因 为 


ix EAR EAR TE T f¥main # exit retumi& AJ AE AAA IS] o EFI AP 
警告 信息 的 一 种 方法 是 在 main 中 使 用 return 语 句 而 不 是 exit。 但 是 这 样 
做 的 结果 是 不 能 用 UNIX 的 grep 实 用 程序 来 找 出 程序 中 所 有 的 exit 调 用 。 
另 一 个 解决 方法 是 将 main 说 明 为 返回 void 而 不 是 int， 然 后 仍然 调用 
exit。 这 样 做 可 以 避免 编译 镍 的 警告 ， 但 从 程序 设计 角度 看 却 并 不 正 
确 ， 而 且 会 产生 其 他 的 编译 警告 ， 因 为 main 的 返回 类 型 应 当 是 市 符号 
整 型 。 本 章 将 main 表 示 为 返回 整 型 ， 因 为 这 是 ISO C 和 POSIX.1 所 定义 
的 。 

不 同 的 编译 器 产生 警告 消息 的 详细 程度 是 不 一 样 的 。 除 非 使 用 警 
告 选项 ， 否 则 GNU C 编 译 种 不 会 发 出 不 必要 的 警告 消息 。 

下 一 章 我 们 将 了 解 进程 如 何 造成 程序 被 执行 ， 如 何等 待 进程 完 
成 ， 然 后 又 如 何 获取 其 终止 状态 。 

2. 画 数 atexit 

按照 ISO C 的 规定 ， 一 个 进程 可 以 登记 多 至 32 个 函数 ， 这 些 函 数 将 
由 exit 自 动 调用 。 我 们 称 这 些 函 数 为 终止 处 理 程序 (exit handler) , 3f 
调用 atexit 函 数 来 登记 这 些 函 数 。 

#include <stdlib.h> 

int atexit(void (*func)(void)); 

返回 值 : ERJ, illo; 者 出 错 ， 返 回 非 0 

其 中 ，atexit NEB eT ARH, SVAN ce CLR 
MoM, AB ER [SI ME 9 exitii ic Swale 5 Ei] 
STO RAI AA sc» [8] — SIA IK, HARA ° 

终止 处 理 程 序 这 一 机 制 是 由 ANSI C 标 准 于 1989 年 引入 的 。 早 于 
ANSI C 的 系统 ， 如 SVR3 和 4.3BSD， 都 不 提供 这 种 终止 处 理 程序 。 

ISO C 要 求 ， 系 统 至 少 应 支持 32 个 终止 处 理 程序 ， 但 实现 经 常会 提 
供 更 多 的 文 持 (参见 图 2-15) 。 为 了 确定 一 个 给 定 的 平台 文 持 的 最 大 终 
止 处 理 程序 数 ， 可 以 使 用 sysconf 范 数 (如 图 2-14 所 示 ) 


根据 ISO C 和 POSIX.1，exit 首 先 调用 各 终止 处 理 程序 ， 然 后 关闭 
(通过 fclose) 所 有 打开 流 。POSIX.1 扩 展 了 ISO C 标 准 ， 它 说 明 ， 如 车 
程序 调用 exec 函 数 族 中 的 任 一 函数 ， 则 将 清除 所 有 已 安装 的 终止 处 理 程 
序 。 图 7-2 显 示 了 一 个 C 程 序 是 如 何 启动 的 ， 以 及 它 终 止 的 各 种 方式 。 


| 
| 
| 
! 
用 户 进程 
| 
| 
| 
| 


内 核 


图 7-2 一 个 C 程 序 是 如 何 启动 和 终止 的 


注意 ， 内 核 使 程序 执行 的 唯一 方法 是 调用 一 个 exec 函 数 。 进 程 目 愿 
nM NU 法 是 显 式 或 隐 式 地 (通过 调用 exit) 调用 _exit 2X Exit 
进程 也 可 非 自愿 地 由 一 个 信号 使 其 终止 (图 7-2 中 没有 显示 ) 。 
实例 
图 7-3 的 程序 说 明 如 何 使 用 atexit 函 数 。 


#include "apue.h" 


static void my exitl(void); 
Static void my exit2(void); 


int 
main (void) 
( 
if (atexit(my exit2) !- 0) 
err sys("can't register my exit2"); 


if (atexit(my exitl) != 0) 

err sys("can't register my exit1"); 
if (atexit(my exitl) != 0) 

err sys("can't register my exitl"); 


printf("main is done\n"); 
return(0); 


} 


static void 
my_exitl (void) 
{ 
printf("first exit handler\n") ; 
} 


static void 
my_exit2 (void) 
{ 
printf("second exit handler\n") 


Wo O OOO 


图 7-3 终止 处 理 程序 实例 


执行 该 程序 产生 : 

$ ./a.out 

main is done 

first exit handler 

first exit handler 

second exit handler 

终止 处 理 程序 每 登记 一 次 ， 就 会 被 调 用 一 次 。 在 图 7-3 的 程序 中 ， 
第 一 个 终止 处 理 程 序 被 登记 两 次 ， 所 以 也 会 被 调用 两 次 。 注 意 ， 在 


main 中 没有 调用 exit， 而 是 用 了 return 语 句 。 


当 执 行 一 个 程序 时 ， 调 用 exec 的 进程 可 将 命令 行 参数 传递 给 该 新 程 
序 。 这 是 UNIX shell 的 一 部 分 常规 操作 。 在 前 儿 章 的 很 多 实例 中 ， 我 们 
已 经 看 到 了 这 一 

实例 

图 7-4 所 示 的 程序 将 其 所 有 命令 行 参数 都 问 显 到 标准 输出 上 。 注 
意 ， 通 常 的 ee 


#include "apue.h" 


int 
main(int argc, char *argv[]) 


{ 


int ave 

for (i — 0; i < a£gc; itt) /* echo all command-line args */ 
printf("argv[$d]: %s\n", i, argv[i]); 

exit(0); 


图 7-4 将 所 有 命令 行 参数 回 显 到 标准 输出 


编译 此 程序 ， 并 将 可 执行 代码 文件 命名 为 echoarg ， 则 得 到 : 
$ /echoarg arg1 TEST foo 
argv[0]: ./echoarg 


argv[1]: arg1 

argv[2]: TEST 

argv[3]: foo 

ISO C 和 POSIX.1 都 要 求 argv[argc] 是 一 个 空 指针 。 这 就 使 我 们 可 以 
将 参数 处 理 循 环 改写 为 : 


for (i = 0; argv[i] != NULL; i++) 


7.9 


每 个 程序 都 接收 到 一 张 环境 表 。 与 参数 表 一 样 ， 环 境 表 也 是 一 个 
字符 指针 数组 ， 其 中 每 个 指针 包 仿 一 个 以 null 结 束 的 C 字 符 串 的 地 址 。 
全 局 变量 environ 则 包含 了 该 指针 数组 的 地 址 : 

extern char **environ; 

例如 ， 如 果 该 环境 包含 5 个 字符 串 ， 那 么 它 看 起 来 如 图 7-5 中 所 示 。 
其 中 ， 每 个 字符 串 的 结尾 处 都 显 式 地 有 一 个 null 字 节 。 我 们 称 environ 为 
环境 指针 (environment pointer) ， 指 针 数 组 为 环境 表 ， 其 中 各 指针 指 
向 的 字符 串 为 环境 字符 串 。 


环境 指针 环境 表 环境 字符 串 
environ: —— — —»- HOME- / home / sar ^ 0 
———»- PATH=: /bin:/usr/bin\C 
—— — —»- SHELL=/bin/bash\0 
——— USER=sar\ 0 


—L ———w- LOGNAME=sar\0 


NULL 


图 7-5 由 5 个 字符 串 组 成 的 环境 


按照 惯例 ， 环 境 由 

name = value 

这 样 的 字符 串 组 成 ， 如 图 7-5 中 所 示 。 大 多 数 预 定义 名 完全 由 大 写 
字母 组 成 ， 但 这 只 是 一 个 惯例 。 


TEA S b. ARESNUNIXRZUXRmainERZUE3T 2, ERREA 
ZO E E ERO: 

int main(int argc, char *argv[], char *envp[]); 

因为 ISO C 规 定 main 函 数 只 有 两 个 参数 ， 而 且 第 3 个 参数 与 全 局 变 
= environ fH E 45, 25:8 i OK 88 Ze S 4b, B DA POSIX.1 也 规定 应 使 用 
environ 而 不 使 用 第 3 个 参数 。 通 常用 getenv flputenvERZX (07.9) 
来 访问 特定 的 环境 变量 ， 而 不 是 用 environ 变 量 。 但 是 ， 如 果 要 查看 整 
个 环境 ， 则 必须 使 用 environ 指 针 。 


7.6 C 程 序 的 存储 空间 布局 


历史 沿袭 至 今 ，C 程 序 一 直 由 下 列 几 部 分 组 成 : 

“正文 段 。 这 是 由 CPU 执行 的 机 器 指令 部 分 。 通 和解 ， 正 文 段 是 可 共 
EXP demain (如 文本 编辑 器 、C 编 译 器 和 shell 
等 ) 在 存储 器 中 也 只 需 有 一 个 副本 ， 男 外 ， 正 文 段 常 常 是 只 读 的 ， 以 
防止 程序 由 于 意外 pi m 

“初始 化 数据 段 。 通 常 将 此 段 称 为 数据 段 ， 它 包含 了 程序 中 需 明 确 
地 赋 初 值 的 变量 。 例 如 ， C 程 序 中 任何 函数 之 外 的 声明 : 

int maxcount = 99; 

使 此 变量 以 其 初 值 存放 在 初始 化 数据 段 中 。 

“未 初始 化 数据 段 。 LA ;为 bss 段 ， 这 一 名 称 来 产 于 早期 汇 
编程 序 一 个 操作 符 ， 意 思 是 “由 符号 开始 的 块 ” (block started by 
symbol) , 在 程序 开始 执行 之 前 前 ， 内 核 将 此 段 中 的 数据 初始 化 为 0 或 衬 

HET ° ERR FHA: 
long sum[1000]; 
使 此 变量 存放 在 非 初 始 化 数据 段 中 。 


。 栈 。 自 动 变量 以 及 每 次 函数 调用 时 所 需 保 存 的 信息 都 存放 在 此 段 
中 。 每 次 函数 调用 时 ， 其 返回 地 址 以 及 调用 者 的 环境 信息 (如 某 些 机 
器 寄存 器 的 值 都 存放 在 栈 中 。 然 后 ， 最 近 被 调用 的 函数 在 栈 上 为 其 
自动 和 临时 变量 分 配 存储 空间 。 通 过 以 这 种 方式 使 用 栈 ，C 递 归 函 数 可 
ATHE o BREA RSA, RAS, Ai 
数 调用 实例 中 的 变量 集 不 会 影响 另 一 次 函数 调用 实例 中 的 变量 。 

* 堆 。 通 常 在 堆 中 进行 动态 存储 分 配 。 由 于 历史 上 形成 的 惯例 ， 堆 
位 于 未 初始 化 数据 段 和 栈 之 间 。 

图 7-6 显示 了 这 些 段 的 一 种 典型 安排 方式 。 这 是 程序 的 逻辑 布局 ， 
虽然 并 不 要 求 一 个 具体 实现 一 定 以 这 种 方式 安排 其 存储 空间 ， 但 这 是 
一 种 我 们 便于 说 明 的 典型 安排 。 对 于 32 位 Intel x86 处 理 器 上 的 
Linux, JE CPx, 0x08048000 单元 开始 ， 栈 的 则 在 0xC0000000 之 下 开 
始 (在 这 种 特定 结构 中 ， 栈 从 高 地 址 向 低地 址 方向 增长 ) HET AR 
顶 之 间 未 用 的 虚 地 址 空间 很 大 。 


命令 行 参数 
和 环境 变量 


由 exec 初始 化 
» 0 


由 exec 从 程序 
文件 中 读 入 


图 7-6 典型 的 存储 空间 安排 

a.out 中 还 有 若干 其 他 类 型 的 段 ， 如 包含 符 
息 的 段 以 及 包含 动态 共享 库 链 接 表 的 段 等 。 这 
执行 的 程序 映像 中 。 

从 图 7-6 还 可 注意 到 ， 未 初始 化 数据 段 的 内 容 并 不 存放 在 磁 副 程序 
文件 中 。 其 原因 是 ， 内 核 在 程序 开始 运行 前 将 它们 都 设置 为 0。 需要 存 
放 在 磁盘 程序 文件 中 的 段 只 有 正文 段 和 初始 化 数据 段 。 

size(1) 命 令 报 告 正文 段 、 数 据 段 和 bss 段 的 长 度 (以 字 节 为 单 
fit) 。 例 如 : 


号 表 的 段 、 包 含 调试 信 
些 部 分 并 不 装载 到 进程 


$ size /usr/bin/cc /bin/sh 
text data bss dec hex filename 
346919 3576 6680 357175 57337  /usr/bin/cc 
102134 1776 11272 115182  1clee /bin/sh 
第 4 列 和 第 5 列 是 分 别 以 十 进 制 和 十 六 进 制 表示 的 3 段 总 长 度 。 


7.7 REE 


现在 ， 大 多 数 UNIX 系 统 文 持 共享 库 。Arnold[1986] 说 明了 System 
V 上 共享 库 的 一 个 早期 实现 ，Gingell 等 [1987] 则 说 明了 SunOS 上 的 另 一 
个 实现 。 共 享 库 使 得 可 执行 文件 中 不 再 需要 包含 公用 的 库 函 数 ， 而 只 
需 在 所 有 进程 都 可 引用 的 存储 区 中 保存 这 种 库 例 程 的 一 个 副本 。 程 序 
第 一 次 执行 或 者 第 一 次 调用 某 个 库 函 数 时 ， 用 动态 链接 方法 将 程序 与 
共享 库 函 数 相 链 接 。 这 减少 了 每 个 可 执行 文件 的 长 度 ， 但 增加 了 一 些 
运行 时 间 开 销 。 这 种 时 间 开 销 发 生 在 该 程序 第 一 次 被 执行 时 ， 或 者 每 
个 共享 库 函 数 第 一 次 被 调用 时 。 共 享 库 的 另 一 个 优点 是 可 以 用 库 函 数 
的 新 版 本 代替 老 版 本 而 无 需 对 使 用 该 库 的 程序 重新 连接 编辑 (假定 参 
数 的 数目 和 类 型 都 没有 发 生 改 变 ) 。 

在 不 同 的 系统 中 ， 程 序 可 能 使 用 不 同 的 方法 说 明 是 否 要 使 用 共享 
库 。 比 较 典 型 的 有 cc(1) 和 1d(1) 命 令 的 选项 。 作 为 长 度 方面 发 生变 化 的 
例子 ， 先 用 无 共享 库 方式 创建 下 列 可 执行 文件 (典型 的 hello.c 程 序 ) : 


$ gcc -static hello1.c 阻止 gcc 使 用 共享 库 
-TWXIWXI-X 1 sar 879443 Sep 2 10:39 a.out 
text data bss dec hex filename 


787775 6128 11272 805175 c4937  a.out 
$ Is -1 a.out 


$ size a.out 
如 果 再 使 用 共享 库 编译 此 程序 ， 则 可 执行 文件 的 正文 和 数据 段 的 
长 度 都 显著 减 小 : 


$ gcc hellol.c gcc 默认 使 用 共享 库 
-rwxrwxr-x 1 sar 8378 Sep 2 10:39 a.out 
text data bss dec hex filename 
1176 504 16 1696 6a0 aout 
$ Is -l a.out 
$ size a.out 
7.8 存储 空间 


ISO C 说 明了 3 个 用 于 存储 空间 动态 分 配 的 函数 。 
(1) malloc， 分 配 指 定 字 节 数 的 存储 区 。 此 存储 区 中 的 初始 值 不 
确定 。 
(2) calloc， 为 指定 数量 指定 长 度 的 对 象 分 配 存储 空间 。 该 空间 
中 的 每 一 位 (bit) 都 初始 化 为 0。 
(3) realloc， 增 加 或 减少 以 前 分 配 区 的 长 度 。 当 增加 长 度 时 ， 可 
能 需 将 以 前 分 配 区 的 内 容 
移 到 男 一 个 足够 大 的 区 域 ， 以 便 在 尾 端 提供 增加 的 存储 区 ， 而 新 
增 区 域内 的 初始 值 则 不 确定 。 
#include <stdlib.h> 


void *malloc(size_t size); 


void *calloc(size_t nobj, size_t size); 
void *realloc(void *ptr, size_t newsize); 


3 个 函数 返回 值 ， 奎 成功， 返回 非 空 指针 ， 唇 出错， 返回 NULL 


void free(void *ptr); 

1X3 op EUER PDA [BT RET — xe SST AY, TER BT A REI 
数据 对 象 。 例 如 ， 在 一 个 特定 的 系统 上 ， 如 果 最 奇 刻 的 对 齐 要 求 是 ， 
double 必 须 在 8 的 倍数 地 址 单元 处 开始 ， 那 么 这 3 个 函数 返回 的 指针 都 应 
这 样 对 齐 。 

因为 这 3 个 alloc 函数 都 返回 通用 指针 void * ， 所 以 如 果 在 程序 中 
包括 了 4#include<stdlibh> (以 获得 画 数 原型 ) ， 那 么 当 我 们 将 这 些 画 数 
返回 的 指针 赋予 一 个 不 同类 型 的 指针 时 ， 残 不 需要 显 式 地 执行 强制 类 
型 转换 。 未 声明 函数 的 默认 返回 值 为 int， 所 以 使 用 没有 正确 函数 声明 
的 强制 类 型 转换 可 能 会 隐藏 系统 错误 ， 因 为 int 类 型 的 长 度 与 函数 返回 
类 型 值 的 长 度 不 同 (本 例 中 是 指针 ) 。 

Ex X free 释放 ptr 指 癌 的 存储 空间 。 被 释放 的 空间 通常 破 送 入 可 用 
存储 区 池 ， 以 后 ， 可 在 调用 上 壕 3 个 分 配 函 数 时 再 分 配 。 

realloc 芳 数 使 我 们 可 以 增 、 减 以 前 分 配 的 存储 区 的 长 度 (最 常见 的 
用 法 是 增加 该 区 ) 。 例 如 ， 如 果 先 为 一 个 数组 分 配 存储 空间 ， 该 数组 
长 度 为 512， 然 后 在 运行 时 填充 它 ， 但 运行 一 段 时 间 后 发 现 该 数组 原先 
的 长 度 不 够 用 ， 此 时 就 可 调用 realloc 扩充 相应 存储 空间 。 如 果 在 该 存 
储 区 后 有 足够 的 空间 可 供 扩充 ， 则 可 在 原 存储 区 位 置 上 向 高 地 址 方向 
扩充 ， 无 需 移动 任何 原先 的 内 容 ， 并 返回 与 传 给 它 相 同 的 指针 值 。 如 
果 在 原 存储 区 后 没有 足够 的 空间 ， 则 realloc 分 配 男 一 个 足够 大 的 存储 
区 ， 将 现存 的 512 个 元 素数 组 的 内 容 复 制 到 新 分 配 的 存储 区 。 然 后 ， 释 
放 原 存储 区 ， 返 回 新 分 配 区 的 指针 。 因 为 这 种 存储 区 可 能 会 移动 位 
置 ， 所 以 不 应 当 使 任何 指针 指 在 该 区 中 。 习 题 416 和 图 C-3 显 示 了 在 
getcwd 中 如 何 使 用 realloc， 以 处 理 任 何 长 度 的 路 径 名 。 图 17-27 的 程序 
是 使 用 realloc 的 男 一 个 例子 ， 用 其 可 以 避免 使 用 编译 时 固定 长 度 的 数 
组 。 


注意 ，realloc 的 最 后 一 个 参数 是 存储 区 的 新 长 度 ， 不 是 新 、 旧 存储 
区 长 度 之 差 。 作 为 一 个 特例 ， 若 ptr 是 一 个 空 指针 ， 则 realloc 的 功能 与 
malloc 相 同 ， 用 于 分 配 一 个 指定 长 度 为 newsize 的 存储 区 。 

这 些 函 数 的 早期 版 本 允许 调用 realloc 分 配 目 上 次 malloc、realloc 或 
calloc 调 用 以 来 所 释放 的 块 。 这 种 技巧 可 回 济 到 V7， 它 利 用 malloc 的 
搜索 集 略 ， 实 现存 储 器 紧缩 。Solaris 仍 支持 这 一 功能 ， 而 很 多 其 他 平台 
则 不 支持 。 这 种 功能 不 被 赞 同 ， 不 应 再 使 用 。 

这 些 分 配 例 程 通常 用 sbrk(2) 系 统 调用 实现 。 该 系统 调用 扩充 (或 
缩小 ) 进程 的 堆 ( 见 图 7-6) 。malloc 和 free 的 一 个 样 例 实现 请 见 
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昌 然 sbrk 可 以 扩充 或 缩小 进程 的 存储 空间 ， 但 是 大 多 数 malloc 和 
free 的 实现 都 不 减 小 进程 的 存储 空间 。 释 放 的 空间 可 供 以 后 再 分 配 ， 但 
将 它们 保持 在 malloc 池 中 而 不 返回 给 内 核 。 

大 多 数 实现 所 分 配 的 存储 空间 比 所 要 求 的 要 稍 大 一 些 ， 额 外 的 空 
间 用 来 记录 管理 信息 分 配 块 的 长 度 、 指 向 下 一 个 分 配 块 的 指针 
等 。 这 就 意味 着 ， 如 果 超 过 一 个 已 分 配 区 的 尾 端 或 者 在 已 分 配 区 起 始 
位 置 之 前 进行 写 操作 ， 则 会 改写 另 一 块 的 管理 记录 信息 。 这 种 类 型 的 
错误 是 灾难 性 的 ， 但 是 因为 这 种 错误 不 会 很 快 就 暴露 出 来 ， 所 以 也 就 
很 难 发 现 。 

在 动态 分 配 的 缓冲 区 前 或 后 进行 写 操作 ， 破 坏 的 可 能 不 仅仅 是 该 
区 的 管理 记录 信息 。 在 动态 分 配 的 缓冲 区 前 后 的 存储 空间 很 可 能 用 于 
其 他 动态 分 配 的 对 象 。 这 些 对 象 与 破坏 它们 的 代码 可 能 无 关 ， 这 造成 
寻求 信息 破坏 的 源头 更 加 困难 。 

其 他 可 能 产生 的 致命 性 的 错误 是 : 释放 一 个 已 经 释放 了 的 块 ， 调 
用 free 时 所 用 的 指针 不 是 3 个 alloc 函 数 的 返回 值 等 。 如 大 一 个 进程 调用 
malloc 函 数 ， 但 却 环 记 调 用 free 函 数 ， 那 么 该 进程 占用 的 存储 空间 就 会 
连续 增加 ， 这 被 称 为 泄漏 (leakage) 。 如 果 不 调用 free 函 数 释放 不 再 使 


用 的 空间 ， 那 么 进程 地 址 空间 长 度 就 会 慢 慢 增加 ， 直 至 不 再 有 空 用 空 
间 。 此 时 ， 由 于 过 度 的 换 页 开销 ， 会 造成 性 能 下 降 。 

因为 存储 空间 分 配 出 错 很 难 跟踪 ， 所 以 某 些 系统 提供 了 这 些 函 数 
的 另 一 种 实现 版 本 。 每 次 调用 这 3 个 分 配 函 数 中 的 任意 一 个 或 free 时 , 
它们 都 进行 附加 的 检 销 。 在 调用 连接 编辑 希 时 指定 一 个 专用 库 ， 在 程 
序 中 就 可 使 用 这 种 版 本 的 函数 。 此 外 还 有 公共 可 用 的 资源 ， 在 对 其 进 
行 编译 时 使 用 一 个 特殊 标志 就 会 使 附加 的 运行 时 检查 生效 。 

FreeBSD ` Mac OS X 以 及 Linux 通 过 设置 环境 变量 支持 附加 的 调试 
功能 。 男 外 ， 通 过 符号 链接 /etc/malloc.conf 可 将 选项 传递 给 FreeBSD 函 
数 库 。 

替代 的 存储 空间 分 配 程序 

有 很 多 可 蔡 代 malloc 和 free 的 函数 。 某 些 系 统 已 经 提供 蔡 代 存储 空 
间 分 配 函 数 的 库 。 另 一 些 系 统 只 提供 标准 的 存储 空间 分 配 程序 。 如 果 
需要 ， 软 件 开发 者 可 以 下 载 奉 代 函 数 。 下 面 讨论 某 些 替代 函数 和 库 。 

1. libmalloc 

基于 SVR4 的 UNIX 系 统 ， 如 Solaries， 包 含 了 libmalloc 库 ， 它 提供 
了 一 套 与 ISO C 存 储 空 间 分 配 函 数 相 匹 配 的 接口 。1libmalloc 库 包括 
mallopt 函 数 ， 它 使 进程 可 以 设置 一 些 变量 ， 并 用 它们 来 控制 存储 空间 
分 配 程序 的 操作 。 还 可 使 用 另 一 个 名 为 mallinfo 的 函数 ， 以 对 存储 空间 
分 配 程序 的 操作 进行 统计 。 

2. vmalloc 

Vo[1996] 说 明 一 种 存储 空间 分 配 程 序 ， 它 允许 进程 对 于 不 同 的 存储 
区 使 用 不 同 的 技术 。 除 了 一 些 vmalloc 特 有 的 函数 外 ， 该 库 也 提供 了 ISO 
C 存 储 空间 分 配 函 数 的 仿真 器 。 

3. quick-fit 

历史 上 所 使 用 的 标准 malloc 算法 是 最 佳 适 配 或 首次 适 配 存储 分 配 
策略 。gqguick-fit (快速 适 配 ) 算法 比 上 述 两 种 算法 快 ， 但 可 能 使 用 较 多 


存储 空间 。Weinstock 和 Wulf[1988] 对 该 算法 进行 了 描述 ， 该 算法 基于 将 
存储 空间 分 牧 成 各 种 长 度 的 缓冲 区 ， 并 将 未 使 用 的 缓冲 区 按 其 长 度 组 
成 不 同 的 空间 区 列表 。 现 在 许多 分 配 程 序 都 基于 快速 适 配 。 

4. jemalloc 

jemalloc 芳 数 实现 是 FreeBSD 8.0 中 的 默认 存储 空间 分 配 程 序 ， 它 是 
库 函 数 malloc 族 在 FreeBSD 中 的 实现 。 它 的 设计 具有 恨 好 的 可 扩展 性 ， 
可 用 于 多 处 理 器 系统 中 使 用 多 线程 的 应 用 程序 。Evans[2006] 说 明了 具 
体 实现 及 其 性 能 评估 。 

5. TCMalloc 

TCMalloc 函 数 用 于 替代 malloc 函 数 族 以 提供 高 性 能 、 高 扩展 性 和 高 
存储 效率 。 从 高 速 缓存 中 分 配 缓冲 区 以 及 释放 缓冲 区 到 高 速 缓存 中 
时 ， 它 使 用 线程 -本 地 高 速 缓存 来 避免 锁 开 销 。 它 还 有 内 置 的 扒 检 查 程 
序 和 堆 分 析 程 序 帮助 调试 和 分 析 动 态 存储 的 使 用 。TCMalloc 库 是 开源 
可 用 的 ， 是 Google-perftools 工 具 中 的 一 个 。Ghemawat 和 Menage[2005] 
对 此 做 了 人 简单 介绍 。 

6. Kžtalloca 

还 有 一 个 函数 也 值得 一 提 ， 这 就 是 alloca。 它 的 调用 序列 与 malloc 
相同 ， 但 是 它 是 在 当前 函数 的 栈 帧 上 分 配 存 储 空 间 ， 而 不 是 在 堆 中 。 
其 优点 是 : 当 男 数 返 回 时 ， 目 动 释放 它 所 使 用 的 栈 帧 ， 所 以 不 必 再 为 
释放 空间 而 费心 。 其 缺点 是 : aloca 函数 增加 了 栈 帧 的 长 度 ， 而 某 些 系 
统 在 函数 已 被 调用 后 不 能 增加 栈 帧 长 度 ， 于 是 也 残 不 能 文 持 alloca 画 
数 。 尽 管 如 此 ， 很 多 软件 包 还 是 使 用 alloca 函 数 ， 也 有 很 多 系统 实现 了 
该 函数 。 

本 书 中 讨论 的 4 个 平台 都 提供 了 alloca 函 数 。 


7.9 d 


如 同 前 述 ， 环 境 字 符 串 的 形式 是 : 

name=value 

UNIX 内 核 并 不 查看 这 些 字符 串 ， 它 们 的 解释 完全 取决 于 各 个 应 用 
程序 。 例 如 ，shell 使 用 了 大 量 的 环境 变量 。 其 中 某 一 些 在 登录 时 自动 
设置 (如 HOME、USER 等 ) ， 有 些 则 由 用 户 设 置 。 我 们 通常 在 一 个 
shell 启 动 文件 中 设置 环境 变量 以 控制 shell 的 动作 。 例 如 ， 阁 设置 了 环境 
变量 MAILPATH J E zi yt Bourne shell ^ GNU Bourne-again shell 和 
Korn shell 到 哪里 去 查看 邮件 。 

ISO C 定 义 了 一 个 函数 getenv， 可 以 用 其 取 环 境 变量 值 ， 但 是 该 标 
准 又 称 环境 的 内 容 是 由 实现 定义 的 。 

#include <stdlib.h> 

char *getenv(const char *name); 

返回 值 : 指向 与 name 关 联 的 value 的 指针 ; 若 未 找到 ， 返 回 NULL 

注意 ， 此 函数 返回 一 个 指针 ， 它 指向 name=value 字 符 串 中 的 
value。 我 们 应 当 使 用 getenv 从 环境 中 取 一 个 指定 环境 变量 的 值 ， 而 不 是 
直接 访问 environ ° 

Single UNIX Specification 中 的 POSIX.1 定 义 了 某 些 环境 变量 。 如 果 
文 持 XSI 扩 展 ， 那 么 其 中 也 包含 了 男 外 一 些 环境 变量 定义 。 图 7-7 列 出 
了 由 Single UNIX Specification 定 义 的 环境 变量 ， 并 指明 本 书 讨 论 的 4 种 
实现 对 它们 的 支持 情况 。 由 POSIX.1 定 义 的 各 环境 变量 标记 为 。， 否 则 
为 XSI 扩 展 。 本 书 讨论 的 4 种 UNIX 实 现 使 用 了 很 多 依赖 于 实现 的 环境 变 
量 。 注 意 ，ISO C 没 有 定义 任何 环境 变量 。 


FreeBSD Linux 
8.0 32.0 


COLUMNS 
DATEMSK 
HOME 

LANG 

LC ALL 

LC COLLATE 
LC CTYPE 

LC MESSAGES 
LC MONETARY 
LC NUMERIC 


XSI 


终端 宽度 
getdate(3) 模 板 文件 路 径 名 
home 起 始 目录 

本 地 名 

本 地 名 

本 地 排序 名 

本 地 字符 分 类 名 

本 地 消息 名 

本 地 货币 编辑 名 

本 地 数字 编辑 名 


LC_TIME 。 . . . . 本 地 日 期 /时 间 格 式 名 

LINES 。 . . . . 终端 高 度 

LOGNAME . . . . . 登录 名 

MSGVERB 。 。 . . fmtmsg(3) 处 理 的 消息 组 成 部 分 
NLSPATH 。 . . . . 消息 类 模板 序列 

PATH . . . . . FRR up utr oct ERR FE RU ALPE 
PWD . . . . . 当前 工作 目录 的 绝对 路 径 名 
SHELL 。 . . . . 用 户 首选 的 shell 名 

TERM . . . . . 终端 类 型 

TMPDIR 。 . 。 。 . 在 其 中 创建 临时 文件 的 目录 路 径 名 
TZ . . . . . 时 区 信息 


图 7-7 Single UNIX Specification 定 义 的 环境 变量 


除了 获取 环境 变量 值 ， 有 时 也 需要 设置 环境 变量 。 我 们 可 能 希望 
改变 现 有 变量 的 值 ， 或 者 是 增加 新 的 环境 变量 。 《在 下 一 章 将 会 了 解 
到 ， 我 们 能 影响 的 只 是 当前 进程 及 其 后 生成 和 调用 的 任何 子 进程 的 环 
境 ， 但 不 能 影响 父 进程 的 环境 ， 这 通常 是 一 个 shell 进 程 。 尽 管 如 此 ， 
修改 环境 表 的 能 力 仍 然 是 很 有 用 的 。) 遗憾 的 是 ， 并 不 是 所 有 系统 都 
文 持 这 种 能 力 。 图 7-8 列 出 了 由 不 同 的 标准 及 实现 支持 的 各 种 函数 。 


[ES 数 ISO C POSIX.1 FreeBSD 8.0 Linux 3.2.0 MacOS X 10.6.8 Solaris 10 


getenv 


putenv 


setenv 
unsetenv 


clearenv 


图 7-8 对 于 各 种 环境 表 画 数 的 支持 


clearenv > z& Single UNIX Specification 的 组 成 部 分 。 它 被 用 来 删除 
环境 表 中 的 所 有 项 。 在 图 7-8 中 ， 中 间 3 个 函数 的 原型 是 : 
#include <stdlib.h> 
int putenv(char *str); 
函数 返回 值 : Ay, oko; 者 出 错 ， 返 回 非 0 


int setenv(const char *name, const char *value, int rewrite); 


int unsetenv(const char *name); 

两 个 函数 返回 值 : ARJ, ello; Ate, we- 

这 3 个 函数 的 操作 如 下 。 

*putenv 取 形式 为 name=value 的 字符 串 ， 将 其 放 到 环境 表 中 。 如 果 
name 已 经 存在 ， 则 移 删 除 其 原来 的 定义 。 

“setenv 将 name 设 置 为 value。 如 果 在 环境 中 name 已 经 存在 ， 那 么 

(a) 若 rewrite 非 0， 则 首先 删除 其 现 有 的 定义 ， (b) 若 rewrite 为 0， 则 
不 删除 其 现 有 定义 name 不 设置 为 新 的 value， 而 且 也 不 出 错 ) 

*unsetenv 删 除 name 的 定义 。 即 使 不 存在 这 种 定义 也 不 算出 错 。 

注意 ，putenv 和 setenv 之 间 的 差别 。setenv 必 须 分 配 存储 空间 ， 以 便 
依据 其 参数 创建 name=value 字 符 串 。putenv 可 以 自由 地 将 传递 给 它 的 参 
数字 符 串 直接 放 到 环境 中 。 确 实 ， 许 多 实现 瓯 是 这 么 做 的 ， 因 此 ， 将 
存放 在 栈 中 的 字符 串 作为 参数 传递 给 putenv 束 会 发 生 错误 ， 其 原因 是 ， 
从 当前 函数 返回 时 ， 其 栈 帧 占用 的 存储 区 可 能 将 被 重用 。 

这 些 函 数 在 修改 环境 表 时 是 如 何 进 行 操 作 的 呢 ? 对 这 一 问题 进行 
研究 、 考 察 是 非常 有 益 的 。 回 忆 几 7-6， 其 中 ， 环 境 表 〈 指 向 实际 
name=value 字 符 串 的 指针 数组 ) 和 环境 字符 串通 常 存 放 在 进程 存储 空 
间 的 顶部 RZE) 。 删 除 一 个 字符 串 很 简单 只 要 先 在 环境 表 中 
找到 该 指针 ， 然 后 将 所 有 后 续 指 针 都 向 环境 表 首 部 顺 次 移动 一 个 位 
置 。 但 是 增加 一 个 字符 串 或 修改 一 个 现 有 的 字符 串 束 困难 得 多 。 环 境 
表 和 环境 字符 串通 常 占 用 的 是 进程 地 址 空间 的 顶部 ， 所 以 它 不 能 再 问 


高 地 址 方向 (向 上 ) 扩展 : 同时 也 不 能 移动 在 它 之 下 的 各 栈 帧 ， 所 以 
它 也 不 能 向 低地 址 方向 《向 下 ) 扩展 。 两 者 组 合 使 得 该 空间 的 长 度 不 
能 再 增加 。 

(1) 如 果 修 改 一 个 现 有 的 name: 

a. 如 有 果 新 value 的 长 度 少 于 或 等 于 现 有 value 的 长 度 ， 则 只 要 将 新 字 
从 串 复制 到 原 字符 串 所 用 的 空间 中 ; 

b. 如 有 果 新 value 的 长 度 大 于 原 长 度 ， 则 必须 调用 malloc 为 新 字符 串 
分 配 空间 ， 然 后 将 新 字符 串 复制 到 该 空间 中 ， 接 着 使 环境 表 中 针对 
name 的 指针 指向 新 分 配 区 。 

(2) 如 果 要 增加 一 个 新 的 name， 则 操作 就 更 加 复杂 。 首 先 ， 必 须 
调用 malloc 为 name=value 字 符 串 分 配 空间 ， 然 后 将 该 字符 串 复 制 到 此 至 
间 中 。 

a. 如 果 这 是 第 一 次 增加 一 个 新 name， 则 必须 调用 malloc 为 新 的 指 
针 表 分 配 空间 。 接 着 ， 将 原来 的 环境 表 复 制 到 新 分 配 区 ， 并 将 指向 新 
name=value 字 符 串 的 指针 存放 在 该 指针 表 的 表 尾 ， 然 后 又 将 一 个 空 指 
针 存 放 在 其 后 。 最 后 使 environ 指 疝 新 指针 表 。 再 看 一 下 图 7-6， 如 有 果 原 
来 的 环境 表 位 于 栈 顶 之 上 〈 这 是 一 种 常见 情况 ) ， 那 么 必须 将 此 表 移 
至 堆 中 。 

但 是 ， 此 表 中 的 大 多 数 指 守 仍 指向 栈 顶 之 上 的 各 name=value 字 符 
E o 

b. 如 果 这 不 是 第 一 次 增加 一 个 新 name， 则 可 知 以 前 已 调用 malloc 
在 堆 中 为 环境 表 分 配 了 空间 ， 所 以 只 要 调用 realloc， 以 分 配 比 原 空间 
多 存放 一 个 指针 的 空间 。 然 后 将 指向 新 name=value 字 符 串 的 指针 存放 
在 该 表 表 尾 ， 后 面 跟着 一 个 空 指 针 。 


7.10 函数 setjmp 和 longjmp 


在 C 中 ，goto 语 句 是 不 能 跨越 函数 的 ， 而 执行 这 种 类 型 跳 转 功能 的 
是 函数 setjimp 和 longjmp“。 这 两 个 函数 对 于 处 理发 生 在 很 深层 巷 套 函 数 
调用 中 的 出 错 情 况 是 非常 有 用 的 。 

考 虚 图 7-9 程 序 的 骨架 部 分 。 其 主 循 环 是 从 标准 输入 读 一 行 ， 然 后 
调用 do_line 处 理 该 输入 行 。do_line 函 数 调用 get_token 从 该 输入 行 中 取 
下 一 个 标记 。 一 行 中 的 第 一 个 标记 假定 是 一 条 某 种 形式 的 命令 ，switch 
语句 就 实现 命令 选择 。 对 程序 中 示例 的 命令 调用 cmd_add 函 数 。 


#include "apue.h" 


#define TOK ADD 5 
void do line(char *); 
void cmd add (void); 
int get token (void); 


int 
main(void) 


{ 


char line [MAXLINE] ; 
while (fgets(line, MAXLINE, stdin) != NULL) 
do_line (line); 
exit (0); 
} 
char*tok ptr; /* global pointer for get_token() */ 
void 


do_line (char *ptr) /* process one line of input */ 


{ 


int cmd; 


tok_ptr = ptr; 


while ((cmd = get_token()) > 0) { 
switch (cmd) { /* one case for each command */ 
case TOK_ADD: 
cmd add(); 
break; 


) 


void 
cmd add (void) 
( 


int token; 


token = get token(); 
/* rest of processing for this command */ 


) 


int 
get token (void) 
( 
/* fetch next token from line pointed to by tok ptr */ 
} 


图 7-9 进行 命令 处 理 程 序 的 典型 骨架 部 分 

图 7-9 的 程序 的 骨架 部 分 在 读 命令 、 确 定 命令 的 类 型 ， 然 后 调用 相 
应 函数 处 理 每 一 条 命令 这 类 程序 中 是 非常 典型 的 。 图 7-10 显 示 了 调用 了 
cmd_add 之 后 栈 的 大 致使 用 情况 。 

自动 变量 的 存储 单元 在 每 个 函数 的 栈 桢 中 。 数 组 line 在 main 的 栈 帧 
中 ， 整 型 cmd 在 do_line 的 栈 帧 中 ， 整 型 token 在 cmd_add 的 栈 帧 中 。 

如 上 所 述 ， 这 种 形式 的 栈 安 排 是 非常 典型 的 ， 但 并 不 要 求 非 如 此 
不 可 。 栈 并 不 一 定 要 问 低 地 址 方向 扩充 。 某 些 系 统 对 栈 并 没有 提供 特 
殊 的 硬件 支持 ， 此 时 一 个 C 实 现 可 能 要 用 链表 实现 栈 帧 。 

在 编写 图 7-9 这 样 的 程序 时 经 常会 遇 到 的 一 个 问题 是 ， 如 何 处 理 非 
致命 性 的 错误 。 例 如 ， 和 若 cmd add 函数 发 现 一 个 错误 〈 比 如 一 个 无 效 
的 数 ) ， 那 么 它 可 能 先 打印 一 个 出 错 消息 ， 然 后 忽略 输入 行 的 余下 部 
分 ， 返 回 main 函 数 并 读 下 一 输入 行 。 但 是 如 果 这 种 情况 出 现在 main 画 


Zi rp BU TRI UE EBEN. ACW A E NMa uS (在 本 例 中 ， 
cmd_add 函 数 只 比 main 低 两 个 层次 ， 在 有 些 程序 中 往往 低 5 个 层次 或 更 
Z) 。 如 果 我 们 不 得 不 以 检查 返回 值 的 方法 逐 层 返 回 ， 那 就 会 变 得 很 
Wi e 


He a m AB 高 地 址 
main 
的 栈 帧 
do line 
的 栈 帧 
cmd add 
的 栈 帧 
栈 扩展 的 
方向 
低地 址 
图 7-10 调用 cmd_add 后 的 各 个 栈 帧 
解决 这 种 问题 的 方法 就 是 使 用 非 局 部 goto 一 setimp 和 1longjmp 画 


数 。 非 局 部 指 的 是 ， 这 不 是 由 普通 的 C 语 言 goto 语 句 在 一 个 函数 内 实施 
的 跳 转 ， 而 是 在 栈 上 路 过 铬 干 调用 帧 ， 返 回 到 当前 函数 调用 路 径 上 的 
某 一 个 函数 中 。 
#include <setjmp.h> 
int setjmp(jmp. buf env); 
返回 值 : 者 直接 调用 ， 返 回 0; 在 从 longjmp 返 回 ， 则 为 非 0 


void longjmp(jmp. buf env, int val); 


在 希望 返回 到 的 位 置 调 用 setjmp， 在 本 例 中 ， 此 位 置 在 main 范 数 
中 。 因 为 我 们 直接 调用 该 贸 数 ， 所 以 其 返回 值 为 0。 setjmp 参 数 env 的 类 
型 是 一 个 特殊 类 型 jmp_buf。 这 一 数据 类 型 是 某 种 形式 的 数组 ， 其 中 存 
放 在 调用 longjmp 时 能 用 来 恢复 栈 状 态 的 所 有 信息 。 因 为 需 在 另 一 个 函 
数 中 引用 env 变 量 ， 所 以 通常 将 env 变 量 定 义 为 全 局 变量 。 

当 检 查 到 一 个 错误 时 ， 例 如 在 cmd_add 函 数 中 ， 则 以 两 个 参数 调用 
longjmp 芳 数 。 第 一 个 就 是 在 调用 setjmp 时 所 用 的 env;， 第 二 个 参数 是 具 
韭 0 值 的 val， 它 将 成 为 从 setjmp 处 返回 的 值 。 使 用 第 二 个 参数 的 原因 是 
对 于 一 个 setjmp 可 以 有 多 个 longjmp。 例如， 可 以 在 cmd_add 中 以 val 为 1 
调用 longjmp t AJ Eget token F Ll val 2 Js] H longjmp ° f£ main ES Zi 
中 ，setjmp 的 返回 值 束 会 是 1 或 >， 通过 测试 返回 值 束 可 判断 造成 返回 的 
longjmp 是 在 cmd_add 还 是 在 get_token 中 。 

再 回 到 程序 实例 中 ， 图 7-11 中 给 出 了 经 修改 过 后 的 main 和 cmd_add 
函数 (其 他 两 个 函数 do_line 和 get_token 示 更改 ) 


#include "apue.h" 
#include <setjmp.h> 


#define TOK ADD 5 


jmp buf  jJmpbuffer; 


int 
main (void) 
{ 
char line [MAXLINE] ; 


if (setjmp(jmpbuffer) != 0) 
printf ("error"); 

while (fgets(line, MAXLINE, stdin) != NULL) 
do_line(line); 

exit (0); 


void 
cmd_add (void) 
{ 


int token; 


token = get_token(); 

if (token < 0) /* an error has occurred */ 
longjmp(jmpbuffer, 1); 

/* rest of processing for this command */ 


图 7-11 setjmp 和 longjmp 实 例 

执行 main 时 ， 调 用 setjmp， 它 将 所 需 的 信息 记 入 变量 jmpbuffer 中 并 
返回 0。 然 后 调用 do_line， 它 又 调用 cmd_add， 假 定 在 其 中 检测 到 一 个 
EIR ° Æ cmd add 中 调用 longjmp 之 前 ， 栈 如 图 7-10 中 所 示 。 但 是 
longjmp 使 栈 反 绕 到 执行 main 碎 数 时 的 情况 ， 也 就 是 抛弃 了 cmd_add 和 
do_line 的 栈 帧 (OUR 7-12) 。 调 用 longjmp 造成 main 中 setjmp 的 返 
E, 但 是 ， 这 一 次 的 返回 值 是 1 (longjmp 的 第 二 个 参数 ) 。 


栈 的 底部 高 地 址 


main 的 栈 帧 


栈 扩展 的 方向 | 
低地 址 


图 7-12 在 调用 longjmp 后 的 栈 帧 
1. 自动 变量 、 寄 存 器 变量 和 易 失 变量 
我 们 已 经 了 解 在 调用 longjmp 后 栈 帧 的 基本 结构 ， 下 一 个 问题 是 : 
“在 main 函 数 中 ， 目 动 变量 和 寄存 器 变量 的 状态 如 何 ? ” 当 longjmp 返 回 
到 main 函数 时 ， 这 些 变量 的 值 是 否 能 恢复 到 以 前 调用 setjmp 时 的 值 
( 即 回 深 到 原先 值 ， 或 者 这 些 变量 的 值 保持 为 调用 do_line 时 的 值 
(do_line 调 用 cmd_add，cmd_add 又 调用 longjmp) ”遗憾 的 是 ， 对 此 
问题 的 回答 是 “看 情况 ”。 大 多 数 实 现 并 不 回 滚 这 些 上 自动 变量 和 寄存 器 
变量 的 值 ， 而 所 有 标准 则 称 它 们 的 值 是 不 确定 的 。 如 果 你 有 一 个 目 动 
变量 ， 而 义 不 想 使 其 值 回 演 ， 则 可 定义 其 为 具有 volatile 属 性 。 声 明 为 
全 局 变量 或 静态 变量 的 值 在 执行 longjmp 时 你 持 不 变 。 
实例 
下 面 我 们 通过 图 7-13 程 序 说 明 在 调用 longjmp 后 ， 目 动 变量 、 全 局 
节 量 、 寄 存 融 变量 、 静 态 变 量 和 易 失 变量 的 不 同情 况 。 


#include "apue.h" 


#include <setjmp.h> 


Static void  fl(int, int, ant, ints 
static void f2(void); 


Static jmp buf jmpbuffer; 
static int globval; 


int 
main (void) 


( 


int autoval; 
register int regival; 
volatile int volaval; 
static inb statval; 


globval = 1; autoval = 2; regival 3; volaval = 4; statval 
if (setjmp(jmpbuffer) != 0) ( 
printf ("after longjmp: Mn"); 
printf("globval = $d, autoval = %d, regival = %d," 
" yolaval = $d, statval = $dMn", 
globval, autoval, regival, volaval, statval); 


exit (0); 
} 
/* 
* Change variables after setjmp, but before longjmp. 
ef 
globval = 95; autoval = 96; regival = 97; volaval = 98; 
statval = 99; 


fl(autoval, regival, volaval, statval); /* never returns */ 
exit (0); 


static void 
fl(int 2, dnt. j, int X; nt 1) 
{ 
printf("in f£1():\n"); 
printf ("globval = $d, autoval = $d, regival = %d," 
" volaval = %d, statval = %d\n", globval, i, j, k, 1); 
£20; 


static void 
£2 (void) 
{ 
longjmp(jmpbuffer, 1); 


图 7-13 longjmp 对 各 类 变量 的 影响 
如 有 果 以 不 融 优 化 和 带 优化 选项 对 此 程序 分 别 进行 编译 ， 然 后 运行 
它们 ， 则 得 到 的 结果 是 不 同 的 : 


$ gcc testjmp.c 不 进行 任何 优化 的 编译 
$ /a.out 
in f10: 


globval = 95, autoval = 96, regival = 97, volaval = 98, statval = 99 

after longjmp: 

globval = 95, autoval = 96, sin = 97, volaval = 98, statval = 99 

$ gcc -O testjmp.c 进行 全 部 优化 的 编译 

$ /a.out 

in f1(): 

globval = 95, autoval = 96, regival = 97, volaval = 98, statval = 99 

after longjmp: 

globval = 95, autoval = 2, regival = 3, volaval = 98, statval = 99 

注意 ， 全 局 变量 、 静 态 变 量 和 易 失 变量 不 受 优化 的 影响 ， 在 
longjmp 之 后 ， 它 们 的 值 是 最 近 所 呈现 的 值 。 在 某 个 系统 的 setjmp(3) 手 
册页 上 说 明 ， 存 放 在 存储 絮 中 的 变量 将 具有 longjmp 时 的 值 ， 而 在 CPU 
和 浮 点 寄存 器 中 的 变量 则 恢复 为 调用 setjimp 时 的 值 。 这 确实 就 是 运行 图 
7-13 程 序 时 所 观察 到 的 值 。 不 进行 优化 时 ， 所 有 这 5 个 变量 都 存放 在 存 
储 器 中 ( 即 忽 略 了 对 regival 变 量 的 register 存 储 类 说 明 ) 。 而 进行 了 优化 
后 ，autoval 和 regival 都 存放 在 寄存 器 中 (即使 autoval 并 未 说 明 为 
register) ，volatile 变 量 则 仍 存放 在 存储 器 中 。 通 过 这 一 实例 我 们 可 以 
理解 到 ， 如 果 要 编写 一 个 使 用 非 局 部 跳 转 的 可 移植 程序 ， 则 必须 使 用 
volatile 属 性 。 但 是 从 一 个 系统 移植 到 另 一 个 系统 ， 其 他 任何 事情 都 可 
能 改变 。 


在 图 7-13 中 ， 某 些 printf 的 格式 字符 串 可 能 不 适宜 安排 在 程序 文本 
的 一 行 中 。 我 们 没有 将 其 分 成 多 个 printf 调 用 ， 而 是 使 用 了 ISO C 的 字符 
串 连 接 功能 ， 于 是 两 个 字符 串 序 列 

"string1" "string2" 

等 价 于 

"string1string2" 

第 10 章 讨 论 信号 处 理 程序 及 sigsetimp 和 siglongjmp 时 ， 将 再 次 涉 
及 setjmp 和 longjmp 函 数 。 

2. 自动 变量 的 潜在 问题 

前 面 已 经 说 明了 处 理 栈 帧 的 一 般 方 式 ， 现 在 值得 分 析 一 下 自动 变 
量 的 一 个 湾 在 出 销 情 况 。 基 本 规则 是 声明 目 动 变 量 的 函数 已 经 返回 
后 ， 不 能 再 引用 这 些 目 动 变 量 。 在 整个 UNIX 手 册 中 ， 关 于 这 一 点 有 很 
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图 7-14 中 给 出 了 一 个 名 为 open_data 的 函数 ， 它 打开 了 一 个 标准 IO 
流 ， 然 后 为 该 流 设置 缓冲 。 


#include <stdio.h> 


FILE * 
open_data (void) 
{ 
FILE *fp; 
Char databuf[BUFSIZ]; /* setvbuf makes this the stdio buffer */ 


if ((fp = fopen("datafile", "r")) == NULL) 
return (NULL) ; 

if (setvbuf(fp, databuf, _IOLBF, BUFSIZ) != 0) 
return (NULL); 

return(fp); /* error */ 


图 7-14 自动 变量 的 不 正确 使 用 
问题 是 : 当 open_data 返 回 时 ， 它 在 栈 上 所 使 用 的 空间 将 由 下 一 个 

被 调用 函数 的 栈 幅 使 用 。 但 是 ， 标 准 WO 库 函数 仍 将 使 用 这 部 分 存储 空 

则 作为 该 流 的 绥 冲 区 。 这 就 产生 了 冲突 和 混乱 。 为 了 改正 这 一 问题 ， 


应 在 全 局 存储 空间 静态 地 (如 static 或 extern) 或 者 动态 地 (使 用 一 种 
allockH 2) 为 数组 databuf 分 配 空间 。 


7.11 函数 getrlimit 和 setrlimit 


每 个 进程 都 有 一 组 资源 限制 ， 其 中 一 些 可 以 用 getrlimit 和 setrlimit 范 
DEVAN BE ° 

#include <sys/resource.h> 

int getrlimit(int resource, struct rlimit *rlptr); 

int setrlimit(int resource, const struct rlimit *rlptr); 

两 个 函数 返回 值 : ARH, welo 者 出 钳 ， 返 回 非 0 

这 两 个 函数 在 Single UNIX Specification 的 XSI 扩 展 中 定义 。 进 程 的 
资源 限制 通常 是 在 系统 初始 化 时 由 0 进程 建立 的 ， 然 后 由 后 续 进 程 继 
际 。 每 种 实现 都 可 以 用 目 己 的 方法 对 资源 限制 做 出 调整 。 

对 这 两 个 范 数 的 每 一 次 调用 都 指定 一 个 资源 以 及 一 个 指 癌 下 列 结 
构 的 指针 。 


struct rlimit { 


rlim trlim cur; /* soft limit: current limit */ 
rlim t rlim max; /* hard limit: maximum value for rlim cur */ 
}; 
在 更 改 资 源 限制 时 ， 须 遵循 下 列 3 条 规则 。 
(1) 任何 一 个 进程 都 可 将 一 个 软 限制 值 更 改 为 小 于 或 等 于 其 硬 限 
HHE ° 
(2) 任何 一 个 进程 都 可 降低 其 硬 限 制 值 ， 但 它 必 须 大 于 或 等 于 其 
软 限制 值 。 这 种 降低 ， 对 普通 用 户 而 言 是 不 可 逆 的 。 
(3) 只 有 超级 用 户 进 程 可 以 提高 硬 限制 值 。 


常量 RLIM_INFINITY 指 定 了 一 个 无 限量 的 限制 。 

这 两 个 函数 的 resource 参数 取 下 列 值 之 一 。 图 7-15 显示 哪些 资源 
限制 是 由 Single UNIX Specification 定 义 并 由 本 书 讨 论 的 4 种 UNIX 系 统 
实现 文 持 的 。 


XSI FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 Solaris 10 


IT AS 
RLIMIT CORE 
RLIMIT CPU 
RLIMIT DATA 
RLIMIT FSIZE 
RLIMIT MEMLOCK 
RLIMIT MSGQUEUE 
RLIMIT NICE 
RLIMIT NOFILE 
RLIMIT NPROC 
RLIMIT NPTS 

T RSS 

MIT SBSIZE 
IT SIGPENDING 
IT STACK 
RLIMIT SWAP 
RLIMIT VMEM 


图 7-15 对 资源 限制 的 支持 


RLIMIT AS 进程 总 的 可 用 存储 空间 的 最 大 长 度 (EUH) 。 这 影响 
到 sbrk 函数 (1.1177) 和 mmap 范 数 (14.8 节 ) 。 

RLIMIT CORE core 文 件 的 最 大 字 和 数 ， 若 其 值 为 0 则 阻止 创建 core 
文件 。 

RLIMIT CPU CPU 时 间 的 最 大 量 值 ( 秒 ) ， 当 超过 此 软 限 制 时 ， 
向 该 进程 发 送 SIGXCPU 信 号。 

RLIMIT DATA 数据 段 的 最 大 字 节 长 度 。 这 是 图 7-6 中 初始 化 数 
据 、 非 初始 以 及 堆 的 总 和 。 

RLIMIT_FSIZE 可 以 创建 的 文件 的 最 大 字 广 长 度 。 当 超过 此 软 限制 
时 ， 则 向 该 进程 发 送 SIGXFSZ 信 号。 


RLIMIT MEMLOCK 一 个 进程 使 用 mlock(2) 能 够 锁定 在 存储 空间 
中 的 最 大 字 贡 长度 。 

RLIMIT MSGQUEUE 进程 为 POSIX 消 息 队 列 可 分 配 的 最 大 存储 字 

RLIMIT_NICE 为 了 影响 进程 的 调度 优先 级 ，nice 值 (8.16 节 ) 可 
设置 的 最 大 限制 。 

RLIMIT_NOFILE 每 个 进程 能 打开 的 最 多 文件 数 。 更 改 此 限制 将 影 
响 到 sysconf 范 数 在 参数 _SC_OPEN_MAX 中 返回 的 值 ( 见 2.5.4 节 ) ， 亦 
见 图 2-17。 

RLIMIT_NPROC 每 个 实际 用 户 ID 可 拥有 的 最 大 子 进程 数 。 更 改 
此 限制 将 影响 到 sysconf 范 数 在 参数 _SC_CHILD_MAX 中 返回 的 值 ( 见 
2.5.4 节 ) 。 

RLIMIT NPTS 用 户 可 同时 打开 的 伪 终 端 (第 19 章 ) 的 最 大 数量 。 

RLIMIT RSS 最 大 驻 内 存 集 字 节 长 度 (resident set size in bytes , 
RSS) 。 如 果 可 用 的 物理 存储 器 非常 少 ， 则 内 核 将 从 进程 处 取 回 超过 
RSS 的 部 分 。 

RLIMIT SBSIZE 在 任 一 给 定时 刻 ， 一 个 用 户 可 以 占用 的 套 接 字 绥 
冲 区 的 最 大 长 度 (FT) e 

RLIMIT_SIGPENDING 一 个 进程 可 排队 的 信号 最 大 数量 。 这 个 限 
制 是 sigqueue 函 数 实 施 的 (10.2077) ° 

RLIMIT STACK 栈 的 最 大 字 市 长 度 。 见 图 7-6。 

RLIMIT_SWAP 用 户 可 消耗 的 交换 空间 的 最 大 字 廊 数 

RLIMIT_VMEM 这 是 RLIMIT_AS 的 同义词 。 

资源 限制 影响 到 调用 进程 并 由 其 子 进程 继承 。 这 就 意味 着 ， 为 了 
影响 一 个 用 户 的 所 有 后 续 进程 ， 需 将 资源 限制 的 设置 构造 在 shell 之 
F e MÆ, Bourne shell ^ GNU Bourne-again shell 和 Korn shell 具 有 内 置 


的 ulimit 命 令 ，C shell 具 有 内 置 limit 命 令 。 (umask 和 chdir 函 数 也 必须 是 
shell 内 置 的 。) 

实例 

图 7-16 的 程序 打印 由 系统 文 持 的 所 有 资源 当前 的 软 限制 和 硬 限 制 。 
为 了 在 各 种 实现 上 编译 该 程序 ， 我 们 已 经 条 件 地 包括 了 各 种 不 同 的 资 
源 名 。 注 意 ， 有 些 平台 定义 rlim_t 为 unsigned long long rf] dE unsigned 
long。 在 同一 系统 中 这 个 定义 可 能 也 会 变动 ， 这 取决 于 我 们 在 编译 程序 
候 是 否 文 持 64 位 文件 。 有 些 限 制作 用 于 文件 大 小 ， 因 此 rim t 类 型 必 
须 足 够 大 才能 表示 文件 大 小 限制 。 为 了 避免 使 用 错误 的 格式 说 明 而 导 
致 编译 器 警告 ， 通 常会 首先 把 限制 复制 到 64 位 整 型 ， 这 样 只 需 处 理 一 
种 格式 。 


#include "apue.h" 


#include <sys/resource.h> 


#define doit (name) pr_limits(#name, name) 


static void pr_limits(char *, int); 


int 

main (void) 

{ 

#ifdef RLIMIT AS 
doit (RLIMIT AS); 


#endif 
doit (RLIMIT CORE) ; 
doit (RLIMIT_CPU) ; 
doit (RLIMIT DATA); 
doit (RLIMIT FSIZE); 


#ifdef RLIMIT MEMLOCK 
doit (RLIMIT MEMLOCK); 
#endif 


#ifdef RLIMIT MSGQUEUE 
doit (RLIMIT MSGQUEUE); 
#endif 


#ifdef RLIMIT NICE 
doit(RLIMIT NICE); 
#endif 


doit(RLIMIT NOFILE); 


#ifdef RLIMIT_NPROC 
doit (RLIMIT NPROC) ; 
#endif 


#ifdef RLIMIT NPTS 
doit(RLIMIT NPTS); 
#endif 


#ifdef RLIMIT_RSS 
doit (RLIMIT RSS); 
#endif 


#ifdef RLIMIT SBSIZE 
doit (RLIMIT SBSIZE) ; 
#tendif 


#ifdef RLIMIT_SIGPENDING 
doit (RLIMIT_SIGPENDING) ; 
#tendif 


doit (RLIMIT_STACK) ; 


#ifdef RLIMIT SWAP 
doit(RLIMIT SWAP); 
#endif 


#ifdef | RLIMIT VMEM 
doit (RLIMIT VMEM); 
dendif 


exit(0); 


static void 
pr limits(char *name, int resource) 


{ 
struct rlimit limit; 
unsigned long long lim; 


if (getrlimit(resource, &limit) « 0) 


err sys("getrlimit error for $s", name); 


printf("$-14s ", name); 

if (limit.rlim cur == RLIM INFINITY) { 
printf("(infinite) TY 

) else { 
lim = limit.rlim cur; 
printf("*TOITd X. Daim); 

) 

if (limit.rlim max == RLIM INFINITY) { 
printf (" (infinite)"); 

) else { 
lim = limit.rlim max; 


printf("$1011d", lim); 
} 
putchar((int)'\n'); 


图 7-16 打印 当前 资源 限制 

注意 ， 在 doit 宏 中 使 用 了 ISO C 的 字符 串 创建 算 符 GO ， 以 便 为 每 
个 资源 名 产生 字符 串 值 。 例 如 : 

doit(RLIMIT CORE); 

这 将 由 C 预 处 理 程序 扩展 为 : 

pr_limits("RLIMIT_CORE", RLIMIT CORE); 

在 FreeBSD 下 运行 此 程序 ， 得 到 : 


$ /a.out 

RLIMIT_AS (infinite) (infinite) 
RLIMIT_CORE (infinite) (infinite) 
RLIMIT_CPU (infinite) (infinite) 

RLIMIT_DATA 536870912 536870912 
RLIMIT_FSIZE (infinite) (infinite) 
RLIMIT MEMLOCK (infinite) (infinite) 
RLIMIT NOFILE 3520 3520 
RLIMIT NPROC 1760 1760 
RLIMIT NPTS (infinite) (infinite) 


RLIMIT RSS (infinite) (infinite) 


RLIMIT SBSIZE (infinite) (infinite) 
RLIMIT STACK 67108864 67108864 
RLIMIT SWAP (infinite) (infinite) 
RLIMIT VMEM (infinite) (infinite) 

在 Solaris 下 运行 此 程序 ， 得 到 ; 

$ ./a.out 

RLIMIT AS (infinite) (infinite) 

RLIMIT CORE (infinite) (infinite) 

RLIMIT CPU (infinite) (infinite) 

RLIMIT DATA (infinite) (infinite) 

RLIMIT FSIZE (infinite) (infinite) 

RLIMIT NOFILE 256 65536 

RLIMIT STACK 8388608 (infinite) 

RLIMIT VMEM (infinite) (infinite) 

在 介绍 了 信号 机 制 后 ， 习 题 10.11 将 继续 讨论 资源 限制 。 


7.12 小 结 


理解 UNIX 系 统 环境 中 C 程 序 的 环境 是 理解 UNIX 系 统 进程 控制 特性 
的 先决 条 件 。 本 章 说 明了 一 个 进程 是 如 何 启动 和 终止 的 ， 如 何 向 其 传 
递 参数 表 和 环境 。 虽 然 参 数 表 和 环境 都 不 是 由 内 核 进行 解释 的 ， 但 内 
核 起 到 了 从 exec 的 调用 者 将 这 两 者 传递 给 新 进程 的 作用 。 

本 章 也 说 明了 C 程 序 的 典型 存储 空间 布局 ， 以 及 一 个 进程 如 何 动态 
地 分 配 和 释放 存储 空间 。 详 细 地 了 解 用 于 维护 环境 的 一 些 函 数 是 有 意 
义 的 ， 因 为 它们 涉及 存储 空间 分 配 。 本 章 也 介绍 了 setjmp 和 longjmp ER 


数 ， 它 们 提供 了 一 种 在 进程 内 非 局 部 转移 的 方法 。 最 后 介绍 了 各 种 实 
现 提供 的 资源 限制 功能 。 


习题 


7.1 在 Intel x86 系 统 上 ， 使 用 Linux， 如 果 执 行 一 个 输出 “hello， 
world” 的 程序 但 不 调用 exit 或 return， 则 程序 的 返回 代码 为 13 (用 shell 检 
A) ， 解 释 其 原因 。 

7.2 图 7-3 中 的 printf 函 数 的 结果 何 时 才 被 真正 输出 ? 

7.3 是 否 有 方法 不 使 用 (a) 参数 传递 、 (b) 全 局 变量 这 两 种 方 
法 ， 将 main 中 的 参数 argc 和 argv 传 递 给 它 所 调用 的 其 他 函数 ? 

7.4 在 有 些 UNIX 系统 实现 中 执行 程序 时 访问 不 到 其 数据 段 的 0 单 
元 ， 这 是 一 种 有 意 的 安排 ， 为 什么 ? 

7.5 用 C 语 言 的 typedef 为 终止 处 理 程序 定义 了 一 个 新 的 数据 类 型 
Exitfunc， 使 用 该 类 型 修改 atexit 的 原型 。 

7.6 如 采用 calloc 分 配 一 个 long 型 的 数组 ， 数 组 的 初始 值 是 否 为 0? 
如 果 用 calloc 分 配 一 个 指针 数组 ， 数 组 的 初始 值 是 否 为 空 指针 ? 

7.7 在 7.6 节 结尾 处 size 命 令 的 输出 结果 中 ， 为 什么 没有 给 出 堆 和 栈 
的 大 小 ? 

7.8 为 什么 7.7 节 中 两 个 文件 的 大 小 (879 443 和 8 378) 不 等 于 它们 
各 目 文 本 和 数据 大 小 的 和 ? 

7.9 为 什么 7.7 和 中 对 于 一 个 简单 的 程序 ， 使 用 共享 库 以 后 其 可 执行 
文件 的 大 小 变化 如 此 巨大 ? 

7.10 在 7.10 市 中 我 们 已 经 说 明 为 什么 不 能 将 一 个 指针 返回 给 一 个 目 
动 变量 ， 下 面 的 程序 是 否 正 确 ? 


int 


f1(int val) 


{ 
} 
int num = 0; 
int *ptr = &num; 
if (val == 0) { 
int val; 
val = 5; 
ptr = &val; 
} 


return(*ptr + 1); 


本 章 介 绍 UNIX 系 统 的 进程 控制 ， 包 括 创建 新 进程 、 执 行程 序 和 进 
程 终 止 。 还 将 说 明 进 程 属 性 的 各 种 ID 一 实际 、 有 效 和 保存 的 用 户 ID 和 
组 JD， 以 及 它们 如 何 受到 进程 控制 原 语 的 影响 。 本 章 还 包括 了 解释 器 
文件 和 system 范 数 。 本 章 最 后 讲述 大 多 数 UNIX 系 统 所 提供 的 进程 会 计 
机 制 ， 这 种 机 制 使 我 们 能 够 从 男 一 个 角度 了 解 进程 的 控制 功能 。 


8.2 进程 标识 


每 个 进程 都 有 一 个 非 负 整 型 表示 的 唯一 进程 ID。 因 为 进程 ID 标识 
符 总 是 唯一 的 ， 常 将 其 用 作 其 他 标识 符 的 一 部 分 以 保证 其 唯一 性 。 例 
如 ， 应 用 程序 有 时 就 把 进程 ID 作为 名 字 的 一 部 分 来 创建 一 个 唯一 的 文 
Tr s 
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进程 ID 束 成 为 复 用 的 候选 着 。 大 多 数 UNIX 系统 实现 延迟 复 用 算法 ， 使 
得 赋予 新 建 进程 的 ID 不 同 于 最 近 终 止 进 程 所 使 用 的 ID。 这 防止 了 将 新 
进程 误 认 为 是 使 用 同一 ID 的 某 个 已 终止 的 先前 进程 。 


系统 中 有 一 些 专用 进程 ， 但 具体 细节 随 实现 而 不 同 。ID 为 0 的 进程 
通常 是 调度 进程 ， 常 常 被 称 为 交换 进程 (swapper) 。 该 进程 是 内 核 的 
一 部 分 ， 它 并 不 执行 任何 磁盘 上 的 程序 ， 因 此 也 被 称 为 系统 进程 。 进 
REID 1 通常 是 init 进 程 ， 在 自 举 过 程 结束 时 由 内 核 调用 。 该 进程 的 程序 
文件 在 UNIX 的 早期 版 本 中 是 /etc/init， 在 较 新 版 本 中 是 /sbin/init。 此 进 
程 负责 在 自 举 内 核 后 启动 一 个 UNIX 系 统 。init 通 常 读 取 与 系统 有 关 的 初 

台 化 文件 (vetcrc* 文 件 或 /etwinittab 文件 ， 以 及 在 /etcinit.d 中 的 文 
(E) ， 并 将 系统 引导 到 一 个 状态 (如 多 用 户 ) 。init 进程 决 不 会 终止 。 
它 是 一 个 普通 的 用 户 进程 (与 交换 进程 不 同 ， 它 不 是 内 核 中 的 系统 进 
程 ) ， 但 是 它 以 超级 用 户 特权 运行 。 本 章 稍 后 部 分 会 说 明 init 如 何 成 为 
所 有 孤儿 进程 的 父 进程 。 

在 Mac OS X 10.4 中 ，init 进 程 被 launchd 进 程 奉 代 ， 执 行 的 任务 集 与 
init 相 同 ， 但 扩展 了 功能 。 可 参阅 Singh[2006] 在 5.10 节 中 的 讨论 来 了 解 
launchd 是 如 何 操作 的 。 

每 个 UNIX 系 统 实现 都 有 它 目 己 的 一 套 提 供 操 作 系 统 服 务 的 内 核 进 
程 ， 例 如 ， 在 某 些 UNIX 的 虚拟 存储 絮 实 现 中 ， 进 程 ID 2 是 页 守护 进程 

(page daemon) ， 此 进程 负责 支持 虚拟 存储 器 系统 的 分 页 操作 。 

除了 进程 ID， 每 个 进程 还 有 一 些 其 他 标识 从。 下列 画 数 返回 这 些 

标识 符 。 


#include <unistd.h> 


pid_t getpid(void); 
返回 值 ， 调 用 进程 的 进程 ID 
pid_t getppid(void); 
返回 值 : 调用 进程 的 父 进程 ID 
uid t getuid(void); 
返回 值 : 调用 进程 的 实际 用 户 ID 
uid t geteuid(void); 


返回 值 : 调用 进程 的 有 效用 户 ID 
gid t getgid(void); 
返回 值 : 调用 进程 的 实际 组 ID 
gid t getegid(void); 
返回 值 : 调用 进程 的 有 效 组 ID 
注意 ， 这 些 函 数 都 没有 出 错 返 回 ， 在 下 一 下 讨论 fork 函 数 时 ， 将 进 
一 步 讨 论 父 进程 ID 。 在 4.4 节 中 已 讨论 了 实际 和 有 效用 户 ID 及 组 ID 。 
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#include <unistd.h> 

pid t fork(void); 

返回 值 ， 子 进程 返回 9， 父 进程 返回 子 进程 ID; Amis, eE- 

由 fork 创 建 的 新 进程 被 称 为 子 进 程 (child process) ° fork EK žit yil 
用 一 次 ， 但 返回 两 次 。 两 次 返回 的 区 别 是 子 进程 的 返回 值 是 0， 而 父 进 
程 的 返回 值 则 是 新 建 子 进程 的 进程 ID。 将 子 进程 ID 返回 给 父 进程 的 理 
由 是 : 因为 一 个 进程 的 子 进程 可 以 有 多 个 ， 并 且 没 有 一 个 函数 使 一 个 
进程 可 以 获得 其 所 有 子 进程 的 进程 ID。fork 使 子 进程 得 到 返回 值 0 的 
理由 是 : 一 个 进程 只 会 有 一 个 父 进程 ， 所 以 子 进 程 总 是 可 以 调用 
getppid 以 获得 其 父 进程 的 进程 ID 〈 进 程 ID 0 总 是 由 内 核 交 换 进 程 使 
用 ， 所 以 一 个 子 进程 的 进程 ID 不 可 能 为 0;” 。 

子 进程 和 父 进 程 继 续 执 行 fork 调 用 之 后 的 指令 。 子 进程 是 父 进 程 的 
副本 。 例 如 ， 子 进程 获得 父 进 程 数 据 空间 、 堆 和 栈 的 副本 。 注 意 ， 这 
是 子 进程 所 拥有 的 副本 。 父 进程 和 子 进 程 并 不 共享 这 些 存储 空间 部 
分 。 父 进程 和 子 进程 共享 正文 段 〈《 见 7.6 节 ) ° 


由 于 在 fork 之 后 经 常 跟随 着 exec， 所 以 现在 的 很 多 实现 并 不 执行 一 

个 父 进程 数据 段 、 栈 和 扒 的 完全 副本 。 作 为 奉 代 ， 使 用 了 写 时 复制 
(Copy-On-Write, COW) 技术 。 这 些 区 域 由 父 进程 和 子 进程 共享 ， 而 

且 内 核 将 它们 的 访问 权限 改变 为 只 读 。 如 果 父 进程 和 子 进 程 中 的 任 一 
个 试图 修改 这 些 区 域 ， 则 内 核 只 为 修改 区 域 的 那 块 内 存 制作 一 个 晶 
本 ,通常 是 虚拟 存储 系统 中 的 一 “页 ”。Bach[1986] 的 9.2 广 和 McKusick 
等 [1996] 的 5.67 和 5.7 世 对 这 种 特征 做 了 更 详细 的 说 明 。 

某 些 平台 提供 fork 函数 的 几 种 变 体 。 本 书 讨论 的 4 种 平台 都 支持 
下 节 将 要 讨论 的 vfork(2)。 
Linux 3.2.0 提供 了 男 一 种 新 进程 创建 印 数 一 clone(2) 系 统 调 用 。 这 
种 fork 的 推广 形式 ， 它 允许 调用 者 控制 哪些 部 分 由 父 进 程 和 子 进 程 
FreeBSD 8.0 提 供 了 rfork(2) 系 统 调用 ， 它 类 似 于 Linux 的 clone 系 统 
调用 。rfork 调 用 是 从 Plan 9 操作 系统 (Pike 等 [1995]) 派生 出 来 的 。 

Solaris 10 提 供 了 两 个 线程 库 : 一 个 用 于 POSIX 线 程 (pthreads) , 
男 一 个 用 于 Solaris 线 程 。 在 这 两 个 线程 库 中 ，fork 的 行为 有 所 不 同 。 对 
于 POSIX 线程 ，fork 创建 一 个 进程 ， 它 仅 包 含 调 用 该 fork 的 线程 ， 但 
对 于 Solaris 线 程 ，fork 创 建 的 进程 包含 了 调用 线程 所 在 进程 的 所 有 线程 
的 副本 。 在 Solaris 10 中 ， 这 种 行为 改变 了 。 不 管 使 用 哪 种 线程 库 ，fork 
创建 的 子 进程 只 保留 调用 线程 的 副本 。Solaris 也 提供 了 fork1 函 数 ， 它 
创建 的 进程 只 复制 调用 线程 。 还 有 forkall 函 数 ， 它 创建 的 进程 复制 了 进 
程 中 所 有 的 线程 。 第 11 章 和 第 12 章 将 详细 讨论 线程 。 

实例 

图 8-1 程 序 演示 了 fork 画 数 ， 从 中 可 以 看 到 子 进程 对 变量 所 做 的 改 
变 并 不 影响 父 进程 中 该 变量 的 值 。 
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#include "apue.h" 


int globvar - 6; /* external variable in initialized data */ 
charbuf[] = "a write to stdout\n"; 
int 


main (void) 


{ 


int var; /* automatic variable on the stack */ 
pid_t pid; 


var = 88; 

if (write (STDOUT FILENO, buf, sizeof(buf)-1) != sizeof (buf) -1) 
err_sys("write error"); 

printf ("before fork\n");  /* we don't flush stdout */ 


if ((pid = fork()) < 0) { 
err_sys ("fork error"); 


} else if (pid == 0) { [** child 5*7 
globvar++; /* modify variables */ 
vartt; 
) else { 
sleep(2); /* parent */ 
} 
printf ("pid = %ld, glob = %d, var = %d\n", (long)getpid(), globvar, 
var); 
exit (0); 


如 有 果 执 行 此 程序 则 得 到 : 


图 8-1 forkER AI SC (fl 

$ /a.out 

a write to stdout 

before fork 

pid = 430, glob = 7, var = 89 子 进 程 的 变量 值 改 变 了 
pid = 429, glob = 6, var = 88 父 进程 的 变量 值 没有 改变 
$ a.out > temp.out 

$ cat temp.out 

a write to stdout 

before fork 

pid = 432, glob = 7, var = 89 


before fork 

pid = 431, glob = 6, var = 88 

一 般 来 说 ， 在 fork 之 后 是 父 进 程 完 执行 还 是 子 进程 完 执行 是 不 确定 
的 ， 这 取决 于 内 核 所 使 用 的 调度 算法 。 如 有 果 要 求 父 进程 和 子 进 程 之 间 
相互 同步 ， 则 要 求 某 种 形式 的 进程 则 通信 。 在 图 8-1 程 序 中 ， 父 进程 使 
自己 休 眼 2 s， 以 此 使 子 进 程 先 执行 。 但 并 不 保证 2 s 已 经 足够 ， 在 8.9 市 
讲述 竞争 条 件 时 还 将 谈 及 这 一 问题 及 其 他 类 型 的 同步 方法 。 在 10.16 节 
中 ， 我 们 将 说 明 在 fork 之 后 如 何 使 用 信号 使 父 进 程 和 子 进程 同步 。 

当 写 标准 输出 时 ， 我 们 将 buf 长 度 减 去 1 作为 输出 字 节 数 ， 这 是 为 了 
避免 将 终止 null 字 广 写 出 。strlen 计算 不 包含 终 上 上 null HPA BR 
E, m sizeof 则 计算 包括 终止 null 字 市 的 绥 冲 区 长 度 。 两 者 之 间 的 男 一 
个 差别 是 ， 使 用 strlen 需 进行 一 次 函数 调用 ， 而 对 于 sizeof 而 言 ， 因 为 
缓冲 区 已 用 已 知 字 符 串 进行 初始 化 ， 其 长 度 是 固定 的 ， 所 以 sizeof 是 
在 编译 时 计算 缓冲 区 长 度 。 

注意 图 8-1 所 示 的 程序 中 fork 与 WO 玉 数 之 间 的 交互 关系 。 回 忆 第 3 章 
中 所 述 ，write 玉 数 是 不 帝 缓 冲 的 。 因 为 在 fork 之 前 调用 write， 所 以 其 数 
据 写 到 标准 输出 一 次 。 但 是 ， 标 准 WO 库 是 带 缓 冲 的 。 回 忆 一 下 5.12 
廊 ， 如 果 标 准 输 出 连 到 终端 设备 ， 则 它 是 行 缓冲 的 ;否则 它 是 全 缓冲 
的 。 当 以 交互 方式 运行 该 程序 时 ， 只 得 到 该 printf 输 出 的 行 一 次 ， 其 原 
因 是 标准 输出 缓冲 区 由 换行 行 冲 洗 。 但 是 当 将 标准 输出 重 定 癌 到 一 个 
文件 时 ， 却 得 到 printf 输 出 行 两 次 。 其 原因 是 ， 在 fork 之 前 调用 了 printf 
一 次 ， 但 当 调用 fork 时 ， 该 行 数据 仍 在 缓冲 区 中 ， 然 后 在 将 父 进 程 数 据 
空间 复制 到 子 进程 中 时 ， 该 缓冲 区 数据 也 被 复制 到 子 进程 中 ， 此 时 父 
进程 和 子 进 程 各 上 自 有 了 带 该 行内 容 的 缓冲 区 。 在 exit 之 前 的 第 二 个 printf 
将 其 数据 退 加 到 已 有 的 缓冲 区 中 。 当 每 个 进程 终止 时 ， 其 缓冲 区 中 的 
内 容 都 被 写 到 相应 文件 中 。 

文件 共享 


对 图 8-1 程 序 需 注 意 的 男 一 点 是 :在 重 定向 父 进程 的 标准 输出 时 ， 
子 进程 的 标准 输出 也 个 重 定 同 。 实 际 上 ，fork 的 一 个 特性 是 父 进 程 的 所 
有 打开 文件 插 述 符 都 被 复制 到 子 进程 中 。 我 们 说 “复制 * 是 因为 对 每 个 
文件 描述 符 来 说 ， 束 好 像 执 行 了 dup 函 数 。 父 进程 和 子 进程 每 个 相同 的 
打开 描述 符 共享 一 个 文件 表 项 ( 见 图 3-9) 。 

考虑 下 述 情况 ， 一 个 进程 具有 3 个 不 同 的 打开 文件 ， 它 们 古 标 准 输 
入 、 标 准 输出 和 标准 错误 。 在 从 fork 返 回 时 ， 我 们 有 了 如 图 8-2 中 所 示 
的 结构 。 

重要 的 一 点 是 ， 父 进程 和 子 进程 共享 同一 个 文件 偏 移 量 。 考 虑 下 
述 情况 : 一 个 进程 fork 了 一 个 子 进程 ， 然 后 等 得 子 进程 终止 。 假 是， 作 
为 普通 处 理 的 一 部 分 ， 父 进程 和 子 进程 都 向 标 准 输出 进行 写 操 作 。 如 
果 父 进程 的 标准 输出 已 重 定向 (很 可 能 是 由 shell 实现 的 ， 那 么 子 进 
程 写 到 该 标准 输出 时 ， 它 将 更 新 与 父 进 程 共 享 的 该 文件 的 偏 移 量 。 在 
这 个 例子 中 ， 当 父 进 程 等 待 子 进程 时 ， 子 进程 写 到 标准 输出 ;而 在 子 
进程 终止 后 ， 父 进程 也 写 到 标准 输出 上 ， 并 且 知 道 其 输出 会 奶 加 在 于 
进程 所 写 数据 之 后 。 如 果 父 进程 和 子 进程 不 共享 同一 文件 偏 移 量 ， 要 
实现 这 种 形式 的 交互 就 要 困难 得 多 ， 可 能 需要 父 进程 显 式 地 动作 o 


父 进程 表 项 文件 表 v 节点 表 


文件 状态 标志 v 节 点 信息 
当前 文件 偏 移 量 
v 节点 指针 


文件 状态 标志 


当前 文件 偏 移 量 
v 节点 指针 
v 节点 信息 
了 进程 表 项 和 二] 


文件 状态 标志 


当前 文件 偏 移 量 
V 节点 指针 


fd 
标志 文件 指针 
do[ TI a 


图 8-2 fork 之 后 父 进程 和 子 进 程 之 间 对 打开 文件 的 共享 
如 采 父 进程 和 子 进程 写 同一 描述 符 指 向 的 文件 ， 但 又 没有 任何 形 
式 的 同步 (如 使 父 进程 等 待 子 进程 ，， 那 么 它们 的 输出 就 会 相互 混合 
〈 假 定 所 用 的 描述 符 是 在 fork 之 前 打开 的 ) 。 虽 然 这 种 情况 是 可 能 发 生 
的 〈 见 图 8-2) ， 但 这 并 不 是 常用 的 操作 模式 。 
在 fork 之 后 处 理 文件 摘 述 符 有 以 下 两 种 币 见 的 情况 。 
(1) 父 进程 等 待 子 进程 完成 。 在 这 种 情况 下 ， 父 进程 无 需 对 其 描 
述 符 做 任何 处 理 。 当 子 进 程 终止 后 ， 它 曾 进 行 过 读 、 写 操作 的 任 一 共 
享 描述 符 的 文件 侦 移 量 已 做 了 相应 更 新 。 


(2) 父 进程 和 子 进程 各 自 执行 不 同 的 程序 段 。 在 这 种 情况 下 ， 在 


fork 之 后 ， 父 进程 和 子 进 程 各 自 关 闭 它们 不 需 使 用 的 文件 描述 符 ， 这 样 
束 不 会 干扰 对 方 使 用 的 文件 接 述 符 。 这 种 方法 是 网 络 服 务 进程 经 营 使 
用 的 。 


fi: 


除了 打开 文件 之 外 ， 父 进程 的 很 多 其 他 属性 也 由 于 进程 继承 ， 包 


"实际 用 户 ID、 实 际 组 ID、 有 效用 户 ID、 有 效 组 ID 
附属 组 ID 

“进程 组 ID 

“会话 ID 

"控制 终端 

“设置 用 户 ID 标志 和 设置 组 ID 标志 

“当前 工作 目录 

{RHK 

“文件 模式 创建 屏蔽 字 

“信号 屏蔽 和 安排 

“对 任 一 打开 文件 描述 符 的 执行 时 关闭 (close-on-exec) 标志 
“环境 

“连接 的 共享 存储 段 

“存储 映像 

“资源 限制 

父 进程 和 子 进 程 之 间 的 区 别 具 体 如 下 。 

fork 的 返回 值 不 同 。 

“进程 ID 不 同 。 

“这 两 个 进程 的 父 进程 ID 不 同 : 子 进 程 的 父 进程 ID 是 创建 它 的 进程 


的 ID， 而 父 进程 的 父 进程 ID 则 不 变 。 


fT Xt FeHtms_utime ^ tms stime ^ tms_cutime i tms_ustimeH) [E 3 
置 为 0 〈 这 些 时 间 将 在 8.17 节 中 介绍 ) 。 
“于 进程 不 继承 父 进程 设置 的 文件 锁 。 
" 子 进程 的 未 处 理 闹 钟 被 清除 。 
“于 进程 的 未 处 理 信号 集 设置 为 空 集 。 
其 中 很 多 特性 至 今 尚 未 讨论 过 ， 我 们 将 在 以 后 几 间 中 对 它们 进行 
WHH o 
使 fork 失 败 的 两 个 主要 原因 是 : (a) 系统 中 已 经 有 了 太 多 的 进程 
(通常 意味 着 某 个 方面 出 了 问题 ) ， (b) 该 实际 用 户 ID 的 进程 总 数 超 
过 了 系统 限制 。 回 忆 图 2-11， 其 中 CHILD_MAX 规 定 了 每 个 实际 用 户 ID 
在 任 一 时 刻 可 拥有 的 最 大 进程 数 。 
fork 有 以 下 两 种 用 法 。 
(1) 一 个 父 进程 希望 复制 自己 ， 使 父 进程 和 子 进程 同时 执行 不 同 
的 代码 段 。 这 在 网 络 服 务 进 程 中 是 第 见 的 一 父 进 程 等 每 客户 并 的 服务 
请 求 。 当 这 种 请 求 到 达 时 ， 父 进程 调用 fork， 使 子 进程 处 理 此 请 求 。 父 
进程 则 继续 等 待 下 一 个 服务 请 求 。 
(2) 一 个 进程 要 执行 一 个 不 同 的 程序 。 这 对 shell 是 常见 的 情 
况 。 在 这 种 情况 下 ， 子 进程 从 fork 返 回 后 立即 调用 exec (我 们 将 在 8.10 
节 说 明 exec) 。 
某 些 操作 系统 将 第 2 种 用 法 中 的 两 个 操作 (fork 之 后 执行 exec) 
组 合成 一 个 操作 ， 称 为 spawn。UNIX 系 统 将 这 两 个 探 作 分 开 ， 因 为 在 
很 多 场合 需要 单独 使 用 fork， 其 后 并 不 跟随 exec。 另 外 ， 将 这 两 个 操作 
分 开 ， 使 得 子 进程 在 fork 和 exec 之 间 可 以 更 改 目 己 的 属性 ， 如 IO 重 定 
向 、 用 户 ID、 信 和 号 安排 等 。 在 第 15 章 中 有 很 多 这 方面 的 例子 。 
Single UNIX Specification 在 高 级 实时 选项 组 中 确实 包括 了 spawn 接 
口 。 但 是 该 接口 并 不 想 蔡 换 fork 和 exec。 它 们 的 目的 是 支持 难于 有 效 实 
现 fork 的 系统 ， 特 别 是 对 存储 管理 缺少 硬件 文 持 的 系统 。 


8.4 贺 数 vfork 


vfork 范 数 的 调用 序列 和 返回 值 与 fork 相 同 ， 但 两 者 的 语义 不 同 。 

vfork 起 源 于 较 早 的 2.9BSD ° EE AGAS, AAR EA TEUER ° (E 
是 本 书 讨论 的 4 种 平台 都 文 持 它 。 事 实 上 ，BSD 的 开发 者 在 44BSD 
中 删除 了 该 函数 ， 但 4.4BSD 派生 的 所 有 开放 源码 BSD 版 本 又 将 其 收 
回 。 在 SUSv3 中 ，vfork 被 标记 为 弃 用 的 接口 ， 在 SUSv4 中 被 完全 删除 。 
我 们 只 是 由 于 历史 的 原因 还 是 把 它 包 含 进来 。 可 移植 的 应 用 程序 不 应 
该 使 用 这 个 函数 。 

vfork 函 数 用 于 创建 一 个 新 进程 ， 而 该 新 进程 的 目的 是 exec 一 个 新 
程序 〈 如 上 一 节 末尾 的 (2) 中 一 样 ) 。 图 1-7 程 序 中 的 shell 基 本 部 分 就 
是 这 类 程序 的 一 个 例子 。vfork 与 fork 一 样 都 创建 一 个 子 进 程 ， 但 是 它 并 
不 将 父 进 程 的 地 址 空间 完全 复制 到 子 进程 中 ， 因 为 子 进 程 会 立即 调用 
exec (或 exit) ， 于 是 也 就 不 会 引用 该 地 址 空间 。 不 过 在 子 进程 调用 
exec 或 exit 之 前 ， 它 在 父 进 程 的 空间 中 运行 。 这 种 优化 工作 方式 在 某 些 
UNIX 系 统 的 实现 中 提高 了 效率 ,但 如 果子 进程 修改 数据 (除了 用 于 存 
放 vfork 返 回 值 的 变量 ) 、 进 行 函数 调用 、 或 者 没有 调用 exec 或 exit W 
返回 都 可 能 会 市 来 未 知 的 结果 。 (WARE TFE, SMRKE 
时 复制 技术 以 提高 fork 之 后 跟随 exec 操 作 的 效率 ， 但 是 不 复制 比 部 分 复 
制 还 是 要 快 一 些 。) 

vfork 和 fork 之 间 的 男 一 个 区 别 是 : vfork 保 证 子 进程 和 完 运行 ， 在 它 
调用 exec 或 exit 之 后 父 进程 才 可 能 被 调度 运行 ， 当 子 进程 调用 这 两 个 画 
数 中 的 任意 一 个 时 ， 父 进程 会 恢复 运行 。〈 如 果 在 调用 这 两 个 函数 之 
前 子 进程 依赖 于 父 进 程 的 进一步 动作 ， 则 会 导 人 致死 锁 。) 

实例 
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fork， 删 除了 对 于 标准 输出 的 write 调用 。 另 外 ， 我 们 也 不 再 需要 让 父 进 
程 调用 sleep， 因 为 我 们 可 以 保证 ， 在 子 进程 调用 exec 或 exit 之 前 ， 内 核 
会 使 父 进程 处 于 休眠 状态 。 


#include "apue.h" 


int 


int 


globvar - 6; /* external variable in initialized data */ 


main (void) 


{ 


int var; /* automatic variable on the stack */ 
pid t pid; 


var = 88; 
printf("before vfork\n"); /* we don't flush stdio */ 
if ((pid = vfork()) < 0) { 
err sys("vfork error"); 
) else if (pid == 0) { /* child */ 


globvart*; /* modify parent's variables */ 
vartt; 
_exit (0); /* child terminates */ 


/* parent continues here */ 

printf ("pid = %ld, glob = %d, var = %d\n", (long)getpid(), globvar, 
var); 

exit (0); 


图 8-3 vfork iK Æ] 


运行 该 程序 得 到 : 

$.la.out 

before vfork 

pid = 29039, glob = 7, var = 89 

子 进程 对 变量 做 增 1 的 操作 ， 结 果 改 变 了 父 进程 中 的 变量 值 。 因 为 


子 进 程 在 父 进程 的 地 址 至 间 中 运行 ， 所 以 这 并 不 令 人 惊讶 。 但 是 其 作 
用 的 确 与 fork 不 同 。 


注意 ， 在 图 8-3 程 序 中 ， 调 用 了 _exit 而 不 是 exit。 正 如 7.3 节 所 壕 ， 
_exit 并 不 执行 标准 WO 缓冲 区 的 冲洗 操作 。 如 果 调 用 的 是 exit 而 不 是 
exit， 则 该 程序 的 输出 是 不 确定 的 。 它 依赖 于 标准 WO 库 的 实现 ， 我 们 


可 能 会 看 到 输出 没有 发 生变 化 ， 或 首发 现 没 有 出 现 父 进 程 的 printf 输 
IH o 


如 有 果子 进程 调用 exit， 实 现 冲 洗 标准 UO 流 。 如 有 果 这 是 函数 库 采 取 
的 唯一 动作 ， 那 么 我 们 会 见 到 这 样 操 作 的 输出 与 子 进 程 调用 _exit 所 产 
生 的 输出 完全 相同 ， 没 有 任何 区 别 。 如 有 果 该 实现 也 关闭 标准 VO Tit, 3E 
么 表示 标准 输出 FILE 对 象 的 相关 存储 区 将 被 清 0。 因 为 子 进程 借用 了 
父 进程 的 地 址 空间 ， 所 以 当 父 进程 恢复 运行 并 调用 printf 时 ， 也 就 不 会 
产生 任何 输出 ，printf 返 回 -1。 注 意 ， 父 进程 的 STDOUT_FILENO 仍 然 
有 效 ， 子 进程 得 到 的 是 父 进程 的 文件 描述 符 数组 的 副本 (参见 图 8- 
2) 5 

大 多 数 exit 的 现代 实现 不 再 在 流 的 关闭 方面 自 找 麻烦 。 因 为 进程 即 
将 终止 ， 那 时 内 核 将 关闭 在 进程 中 已 打开 的 所 有 文件 描述 符 。 在 库 中 
关闭 这 些 ， 只 是 增加 了 开销 而 不 会 带 来 任何 益处 。 

McKusick 等 [1996] 的 5.6 节 中 包含 了 fork 和 vfork 实 现 方 面 的 更 多 信 
上 县。 习题 8.1 和 习题 8.2 将 继续 对 vfork 进 行 讨论 。 


8.5 exit 


如 7.3 节 所 述 ， 进 程 有 5 种 正常 终止 及 3 种 异常 终止 方式 。5 种 正常 终 
止 方式 具体 如 下 。 
(1) 在 main 函 数 内 执行 return 语 句 。 如 在 7.3 节 中 所 述 ， 这 等 效 于 
调用 exit。 


(2) 调用 exit 函 数 。 此 函数 由 ISO C 定 义 ， 其 操作 包括 调用 各 终止 
处 理 程序 (终止 处 理 程序 在 调用 atexit 函 数 时 登记 ) ， 然 后 关闭 所 有 标 
准 IO 流 等 。 因 为 ISO C 并 不 处 理 文件 描述 符 、 多 进程 ( 父 进程 和 子 进 
FR) 以 及 作业 控制 ， 所 以 这 一 定义 对 UNIX 系 统 而 言 是 不 完整 的 。 

(3) 调用 _exit 或 _Exit 函 数 。ISOC 定 义 _Exit， 其 目的 是 为 进程 提 
供 一 种 无 需 运 行 终止 处 理 程序 或 信号 处 理 程序 而 终止 的 方法 。 对 标准 
VO 流 是 否 进行 冲洗 ， 这 取决 于 实现 。 在 UNIX 系 统 中 ，_Exit 和 _exit 
是 同 义 的 ， 并 不 冲洗 标准 VO 流 。_exit 函数 由 exit 调用 ， 它 处 理 UNIX 
系统 特定 的 细节 。_exit 是 由 POSIX.1 说 明 的 。 

在 大 多 数 UNIX 系 统 实现 中 ，exit(3) 是 标准 C 库 中 的 一 个 函数 ， 而 
exit(2) 则 是 一 个 系统 调用 。 

(4) 进程 的 最 后 一 个 线程 在 其 启动 例 程 中 执行 retum 语 句 。 但 
是 ， 该 线程 的 返回 值 不 用 作 进 程 的 返回 值 。 当 最 后 一 个 线程 从 其 启动 
例 程 返回 时 ， 该 进程 以 终止 状态 0 返回 o 

(5) 进程 的 最 后 一 个 线程 调用 pthread exit 函数 。 如 同 前 面 一 
样 ， 在 这 种 情况 中 ， 进 程 终 止 状态 总 是 0， 这 与 传送 给 pthread_exit 的 参 
数 无 天 。 在 11.5 广 中 ， 我 们 将 对 pthread_exit 做 更 多 说 明 » 

3 种 异常 终止 具体 如 下 。 

(1) 调用 abort。 它 产生 SIGABRT 信 号 ， 这 是 下 一 种 异常 终止 的 一 
种 特例 。 

(2) 当 进 程 接收 到 某 些 信号 时 。 (第 10 章 将 较 详 细 地 说 明 信 
So) 信号 可 由 进程 自身 (如 调用 abort 范 数 ) 、 其 他 进程 或 内 核 产 
生 。 例 如 ， 若 进程 引用 地 址 空间 之 外 的 存储 单元 、 或 者 除 以 0， 内 核 就 
会 为 该 进程 产生 相应 的 信号 。 

(3) 最 后 一 个 线程 对 “取消 ” (cancellation) 请 求 作 出 响应 。 默 认 
情况 下 , “取消 ”以 延迟 方式 发 生 : 一 个 线程 要 求 取 消 另 一 个 线程 ， 若 


于 时 间 之 后 ， 目 标 线程 终止 。 在 11.5 Wd 12.7 节 ， 我 们 将 详细 讨论 
“取消 ”请 求 。 

不 管 进程 如 何 终止 ， 最 后 都 会 执行 内 核 中 的 同一 段 代 码 。 这 段 代 
码 为 相应 进程 关闭 所 有 打开 描述 符 ， 释 放 它 所 使 用 的 存储 璐 等 。 

对 上 述 任意 一 种 终止 情形 ， 我 们 都 希望 终止 进程 能 够 通知 其 父 进 
程 它 是 如 何 终止 的 。 对 于 3 个 终止 画 数 (exit > _exit#_Exit) ， 实 现 这 
一 点 的 方法 是 ， 将 其 退出 状态 (exit status) 作为 参数 传送 给 函数 。 在 
异常 终止 情况 ， 内 核 (不 是 进程 本 身 ) 产生 一 个 指示 其 异常 终止 原因 
的 终止 状态 (termination status) 。 在 任意 一 种 情况 下 ， 该 终止 进程 的 
父 进程 都 能 用 wait 或 waitpid 函 数 (将 在 下 一 市 说 明 ) 取得 其 终止 状态 。 

注意 ， 这 里 使 用 了 “退出 状态 ”( 它 是 传递 给 同 3 个 终止 玉 数 的 参 
数 ， 或 main 的 返回 值 ) 和 “终止 状态 ”两 个 术语 ， 以 表示 有 所 区 别 。 在 
最 后 调用 _exit 时 ， 内 核 将 退出 状态 转换 成 终止 状态 (回忆 图 7-2) 。 图 
8-4 说 明 父 进程 检查 子 进程 终止 状态 的 不 同方 法 。 如 果子 进程 正常 终 
止 ， 则 父 进 程 可 以 获得 子 进程 的 退出 状态 。 

在 说 明 fork 函 数 时 ， 显 而 易 见 ， 子 进程 是 在 父 进程 调用 fork 后 生成 
的 。 上 面 义 说 明了 子 进程 将 其 终止 状态 返回 给 父 进程 。 但 是 如 有 果 父 进 
程 在 子 进程 之 前 终止 ， 又 将 如 何 呢 ?其 回答 是 : 对 于 父 进程 已 经 终止 
的 所 有 进程 ， 它 们 的 父 进 程 都 改变 为 init 进程 。 我 们 称 这 些 进程 由 init 
进程 收养 。 其 操作 过 程 大 致 是 : 在 一 个 进程 终止 时 ， 内 核 逐 个 检查 所 
有 活动 进程 ， 以 判断 它 是 否 是 正 要 终止 进程 的 子 进程 ， 如 果 是 ， 则 该 
进程 的 父 进程 ID 就 更 改 为 1 (init 进 程 的 ID) 。 这 种 处 理 方法 保证 了 每 
个 进程 有 一 个 父 进 程 。 

另 一 个 我 们 关心 的 情况 是 ， 如 采 子 进程 在 父 进程 之 前 终止 ， 那 么 
父 进程 又 如 何 能 在 做 相应 检查 时 得 到 子 进 程 的 终止 状态 呢 ? 如 有 果子 进 
程 完全 消失 了 ， 父 进程 在 最 终 准 备 好 检查 子 进 程 是 否 终止 时 是 无 法 获 
取 它 的 终止 状态 的 。 内 核 为 每 个 终止 子 进程 体 存 了 一 定量 的 信息 ， 所 


以 当 终 止 进程 的 父 进程 调用 wait 或 waitpid 时 ， 可 以 得 到 这 些 信 息 。 这 些 
言 已 至 少 包 括 进 程 ID、 该 进程 的 终止 状态 以 及 该 进程 使 用 的 CPU 时 间 
总 量 。 内 核 可 以 释放 终止 进程 所 使 用 的 所 有 存储 区 ， 关 闭 其 所 有 打开 
文件 。 在 UNIX 术语 中 ， 一 个 已 经 终止 、 但 是 其 父 进程 尚未 对 其 进行 
善后 处 理 〈 获 取 终 止 子 进程 的 有 关 人 信息、 释放 它 仍 占用 的 资源 ) 的 进 
程 被 称 为 僵 死 进程 (zombie) 。ps(1) 命 令 将 僵 死 进程 的 状态 打印 为 Z。 
如 果 编 写 一 个 长 期 运行 的 程序 ， 它 fork 了 很 多 子 进 程 ， 那 么 除非 父 进程 
等 竺 取得 子 进程 的 终止 状态 ， 不 然 这 些 子 进 程 终 止 后 束 会 变 成 伪 死 进 
程 。 
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最 后 一 个 要 考虑 的 问题 是 : 一 个 由 init 进 程 收养 的 进程 终止 时 会 发 
LITA? 它 会 不 会 变 成 一 个 伪 死 进程 ? 对 此 问题 的 回答 是 “ 否 ”"， 因 为 
init 被 编写 成 无 论 何 时 只 要 有 一 个 子 进程 终止 ， init 束 会 调用 一 个 wait 
函数 取得 其 终止 状态 。 这 样 也 束 防 止 了 在 系统 中 塞 满 僵 死 进 程 。 当 可 
及 “一 个 init 的 子 进程 ?时 ， 这 指 的 可 能 是 init 直 接 产生 的 进程 (如 将 在 9.2 
下 说 明 的 getty 进 程 ) ， 也 可 能 是 其 父 进程 已 终止 ， 由 init 收 养 的 进程 。 


8.6 畏 数 wait 和 waitpid 


当 一 个 进程 正音 或 异 过 终止 时 ， 内 核 束 问 其 父 进程 发 送 SIGCHLD 
言 号 。 因 为 子 进程 终止 是 个 异步 事件 (这 可 以 在 父 进程 运行 的 任何 时 
(RACE) ， 所 以 这 种 信号 也 是 内 核 回 父 进程 发 的 异步 通知 。 父 进程 可 
以 选择 忽略 该 信号 ， 或 者 提供 一 个 该 信号 发 生 时 即 被 调用 执行 的 函数 

(信号 处 理 程序 ) 。 对 于 这 种 信号 的 系统 默认 动作 是 忽略 它 。 人 第 10 章 


将 说 明 这 些 选 项 。 现 在 需要 知道 的 是 调用 wait 或 waitpid 的 进程 可 能 会 发 
(rae 

“如 和 朱 其 所 有 子 进程 都 还 在 运行 ， 则 阻塞 。 

“如 采 一 个 子 进 程 已 终止 ， 正 等 竺 父 进程 获取 其 终止 状 人 在， 则 取得 
该 子 进 程 的 终止 状态 立即 返回 。 

“如果 它 没有 任何 子 进程 ， 则 立即 出 错 返 回 。 

如 果 进 程 由 于 接收 到 SIGCHLD 信 和 号 而 调用 wait， 我 们 期 望 wait 会 立 
即 返 回 。 但 是 如 果 在 随机 时 间 点 调用 wait， 则 进程 可 能 会 阻塞 。 


#include <sys/wait.h> 


pid_t wait(int *statloc); 
pid_t waitpid(pid_t pid, int *statloc, int options); 
两 个 函数 返回 值 : 者 成 功 ， 返 回 进程 ID; Ante, KEIO ( 见 后 面 的 说 
明 ) 或 -1 


这 两 个 函数 的 区 别 如 下 。 

“在 一 个 了 于 进程 终止 前 ，wait 使 其 调用 者 阻塞 ， 而 waitpid 有 一 选 
项 ， 可 使 调用 者 不 阻塞 。 

“waitpid 并 不 等 行 在 其 调用 之 后 的 第 一 个 终止 子 进 程 ， 它 有 符 干 个 
夺 项 ， 可 以 控制 它 所 等 待 的 进程 。 

如 有 果子 进程 已 经 终止 ， 并 且 是 一 个 僵 死 进程 ， 则 wait 立 即 返 回 并 取 
得 该 子 进程 的 状态 ， 否 则 wait 使 其 调用 者 阻 寨 ， 直 到 一 个 子 进程 终止 。 
如 调用 者 阻 罕 而 且 它 有 多 个 子 进程 ， 则 在 其 某 一 子 进程 终止 时 ，wait 束 
立即 返回 。 因 为 wait 区 回 终 止 子 进程 的 进程 ID， 所 以 它 总 能 了 解 是 哪 一 
个 子 进程 终止 了 。 

这 两 个 函数 的 参数 statloc 是 一 个 整 型 指针 。 如 果 statloc 不 是 一 个 至 
指针 ， 则 终止 进程 的 终止 状态 就 存放 在 它 所 指向 的 单元 内 。 如 末 不 天 
心 终 止 状态 ， 则 可 将 该 参数 指定 为 空 指针 。 


依据 传统 ， ng d n sa es 其 中 
某 些 位 表示 退出 状态 (正常 返回 ) ， 其 他 位 则 指示 信号 编号 (异常 返 
E), E N dee 1 规定 ， 终 止 状 态 用 
定义 在 <sys/wait.h> 中 的 各 个 宏 来 查看 。 有 4 个 互 斥 的 宏 可 用 来 取得 进程 
ce ae 它们 的 名 字 都 以 WIF 开 始 。 基 于 这 4 个 安 中 哪 一 个 值 为 
H, Way ue 用 其 {他 宏 来 取得 退出 状态 、 信 号 编号 等 。 这 4 个 互 不 的 宏 示 
于 图 8-4 中 。 


Z 说 明 


WIFEXITED (status) 若 为 正常 终止 子 进 程 返回 的 状态 ， 则 为 真 。 对 于 这 种 情况 可 执行 

EXITSTATUS(status)， 获 取 子 进程 人 3x. exit 或 exit 参数 的 低 8 位 

WIFSIGNALED (status) 若 为 异常 终止 子 进程 返回 的 状态 ， 则 为 真 〈 接 到 一 个 不 捕 提 的 信号 )。 对 于 这 
种 情况 ， 可 执行 WTERMSIG(status)， 获 取 使 子 进程 终止 的 信号 编号 。 另 外 ， 有 


些 实现 〈 非 Single UNIX Specification) jE XZ WCOREDUMP(status)， 若 已 产生 
终止 进程 的 core 文件 ， 则 它 返 回 真 

WIFSTOPPED (status) 若 为 当前 暂停 子 进程 的 返回 的 状态 ， 则 为 真 。 对 于 这 种 情况 ， 可 执行 
WSTOPSIG(status)， 获 取 使 子 进程 暂停 的 信号 编号 

WIFCONTINUED (status) 若 在 作业 控制 暂停 后 已 经 继续 的 子 进 程 返 回 了 状态 ， 则 为 真 (POSIX.1 的 XSI 
扩展 ; 仅 用 于 waitpid) 


图 8-4 检查 wait 和 waitpid 所 返回 的 终止 状态 的 宏 

在 9.8 太 中 讨论 作业 控制 时 ， 将 说 明 如 何 停止 一 个 进程 。 

实例 

图 8-5 中 的 函数 pr_exit 使 用 图 8-4 中 的 宏 以 打印 进程 终止 状态 的 说 
明 。 本 书 中 的 很 多 程序 都 将 调用 此 函数 。 注 意 ， 如 有 果 定 义 了 
WCOREDUMP 宏 ， 则 此 函数 也 处 理 该 宏 。 


#include "apue.h" 
#include <sys/wait.h> 


void 
pr_exit(int status) 
{ 

if (WIFEXITED (status) ) 

printf ("normal termination, exit status = %d\n", 

WEXITSTATUS (status) ); 
else if (WIFSIGNALED (status) ) 

printf ("abnormal termination, signal number = %d%s\n", 
WTERMSIG(status), 
#ifdef WCOREDUMP 

WCOREDUMP (status) ? " (core file generated)" : ""); 


#else 
i. 
fendif 
else if (WIFSTOPPED(status)) 
printf("child stopped, signal number = %d\n", 
WSTOPSIG(status)); 


图 8-5 打印 exit 状 态 的 说 明 


FreeBSD 8.0 ` Linux 3.2.0、Mac OS X 10.6.8 以 及 Solaris 10 都 支持 
WCOREDUMP 宏 。 但 是 如 果 定 义 了 _POSIX_C_SOURCE 常 量 ， 有 些 平 
台 就 隐藏 这 个 定义 (回忆 2.7 节 ) ° 

图 8-6 中 程序 调用 pr_exit 函 数 ， 演 示 终 止 状态 的 各 种 值 。 


#include "apue.h" 
#include <sys/wait.h> 


int 


main (void) 

{ 
pid t pid; 
int status; 


if ((pid = fork()) < 0) 
err sys("fork error"); 


else if (pid == 0) /* child */ 
exit(7); 
if (wait(&status) !- pid) /* wait for child */ 
err_sys ("wait error"); 
pr_exit (status); /* and print its status */ 
if ((pid = fork()) < 0) 
err_sys ("fork error"); 
else if (pid == 0) /* child */ 
abort (); /* generates SIGABRT */ 
if (wait(&status) != pid) /* wait for child */ 


err sys("wait error"); 
pr exit(status); /* and print its status */ 


if ((pid = fork()) < 0) 
err sys("fork error"); 


else if (pid -- 0) /* child */ 

status /- 0; /* divide by 0 generates SIGFPE */ 
if (wait(&status) !- pid) /* wait for child */ 

err sys("wait error"); 
pr exit(status); /* and print its status */ 
exit(0); 


图 8-6 演示 不 同 的 exit 值 


运行 该 程序 可 得 : 

$ ./a.out 

normal termination, exit status = 7 

abnormal termination, signal number - 6 (core file generated) 

abnormal termination, signal number - 8 (core file generated) 

现在 ， 我 们 可 以 从 WTERMSIG 中 打印 信号 编号 。 可 以 查看 
<signal.h> 头 文件 验证 SIGABRT 的 值 为 6，SIGFPE 的 值 为 8。 我 们 将 在 
10.22 节 中 看 到 一 种 可 移植 的 方式 进行 信号 编号 到 说 明 性 名 字 的 映射 。 


正如 前 面 所 述 ， 如 果 一 个 进程 有 几 个 子 进程 ， 那 么 只 要 有 一 个 子 

进程 终止 ，wait 就 返回 。 如 有 果 要 等 待 一 个 指定 的 进程 终止 (如果 知 道 
等 竺 进程 的 ID) ， 那 么 该 如 何 做 呢 ? 在 早期 的 UNIX 版 本 中 ， 必 须 调 

用 wait， 然 后 将 其 返回 的 进程 ID 和 所 期 望 的 进程 ID 相 比较 。 如 果 终 止 进 
程 不 是 所 期 望 的 ， 则 将 该 进程 ID 和 终止 状态 保存 起 来 ， 然 后 再 次 调用 
wait。 反 复 这 样 做 ， 直 到 所 期 望 的 进程 终止 。 下 一 次 又 想 等 待 一 个 特定 
进程 时 ， 先 查看 已 终止 的 进程 列表 ， 若 其 中 已 有 要 等 得 的 进程 ， 则 获 
取 相 关 信 息 ; 否则 调用 wait。 其 实 ， 我 们 需要 的 是 等 待 一 个 特定 进程 的 
函数 。POSIX. 定 义 了 waitpid 函 数 以 提供 这 种 功能 (以 及 其 他 一 些 功 
能 ) 

对 于 waitpid 函 数 中 pid 参 数 的 作用 解释 如 下 。 

pid ==-1 等 竺 任 一 子 进程 。 此 种 情况 下 ，waitpid 与 wait 等 效 。 

pid > 0 等 竺 进程 ID 与 pid 相 等 的 子 进程 。 

pid == 0 等 待 组 ID 等 于 调用 进程 组 ID 的 任 一 子 进程 。 (9.4 节 将 说 
明 进 程 组 。) 

pid «-1 等 待 组 ID 等 于 pid 绝 对 值 的 任 一 子 进程 。 

waitpid 画 数 返 回 终止 子 进 程 的 进程 ID， 并 将 该 子 进程 的 终止 状态 
存放 在 由 statloc 指 向 的 存储 单元 中 。 对 于 wait， 其 唯一 的 出 错 是 调用 进 
程 没有 子 进 程 (函数 调用 被 一 个 信号 中 断 时 ， 也 可 能 返回 男 一 种 出 
错 。 第 10 章 将 对 此 进行 讨论 ) 。 但 是 对 于 waitpid， 如 果 指 定 的 进程 或 
进程 组 不 存在 ， 或 者 参数 pid 指 定 的 进程 不 是 调用 进程 的 子 进 程 ， 都 可 
能 出 错 。 

options 人 参数 使 我 们 能 进一步 控制 waitpid 的 操作 。 此 参数 或 者 是 0， 
或 者 是 图 8-7 中 常量 按 位 或 运算 的 结 
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状态 ， 这 样 它 可 被 再 次 等 待 。 


WCONTINUED 若 实现 支持 作业 控制 ， 那 么 由 pid 指定 的 任 一 子 进 程 在 停止 后 已 经 继续 ， 但 其 状态 尚 
未 报告 ， 则 返回 其 状态 CPOSIX.1 的 XSI 扩展 ) 


若 由 pid 指定 的 子 进程 并 不 是 立即 可 用 的 ， 则 waitpid 不 阻塞 ， 此 时 其 返回 值 为 0 


WUNTRACED 若 某 实现 支持 作业 控制 ， 而 由 pid 指定 的 任 一 子 进程 已 处 于 停止 状态 ， 并 且 其 状态 自 
停止 以 来 还 未 报告 过 ， 则 返回 其 状态 。WIFSTOPPED 宏 确 定 返 回 值 是 否 对 应 于 一 个 停止 
的 子 进程 


-EL 


图 8-7 waitpid 的 options 常 量 
waitpid 范 数 提供 了 wait 范 数 没有 提供 的 3 个 功能 。 
(1) waitpid 可 等 待 一 个 特定 的 进程 ， 而 wait 则 返回 任 一 终止 子 进 
程 的 状态 。 在 讨论 popen 画 数 时 会 再 说 明 这 一 功能 。 
(2) waitpid 提 供 了 一 个 wait 的 非 阻塞 版 本 。 有 了 时 希望 获取 一 个 子 
进程 的 状态 ， 但 不 想 阻 塞 。 
(3) waitpid 通 过 WUNTRACED 和 WCONTINUED 选 项 支持 作业 控 


制 。 

实例 

回忆 8.5 广 中 有 关 僵 死 进 程 的 讨论 。 如 果 一 个 进程 fork 一 个 子 进 
程 ， 但 不 要 它 等 每 子 进程 终止 ， 也 不 希望 子 进程 处 于 伪 死 状态 直到 父 
进程 终止 ， 实 现 这 一 要 求 的 诀 罕 是 调用 fork 两 次 。 图 8-8 程 序 实 现 了 这 
— Ho 


INN 


#include "apue.h" 
#include <sys/wait.h> 


int 
main (void) 
{ 
pid t pid; 


if ((pid = fork()) < 0y { 
err sys("fork error"); 
} else if (pid == 0) { /* first child */ 
if ((pid = fork()) « 0) 
err sys("fork error"); 
else if (pid > 0) 
exit(0); /* parent from second fork == first child */ 


We're the second child; our parent becomes init as soon 
* as our real parent calls exit() in the statement above. 
* Here's where we'd continue executing, knowing that when 


* 


we're done, init will reap our status. 


y 
sleep (2); 
printf ("second child, parent pid = %ld\n", (long)getppid()); 
exit (0); 
} 
if (waitpid(pid, NULL, 0) != pid) /* wait for first child */ 


err sys("waitpid error"); 


/* 

* We're the parent (the original process); we continue executing, 
* knowing that we're not the parent of the second child. 

yf 

exit (0); 


图 8-8 fork 两 次 以 避免 僵 死 进程 


第 二 个 子 进程 调用 sleep 以 保证 在 打印 父 进程 ID 时 第 一 个 子 进程 已 
终止 。 在 fork 之 后 ， 父 进程 和 子 进程 都 可 继续 执行 ， 并 且 我 们 无 法 预知 
哪 一 个 会 先 执行 。 在 fork 之 后 ， 如 果 不 使 第 二 个 子 进程 休 卢 ， 那 么 它 可 
能 比 其 父 进程 先 执 行 ， 于 是 它 打印 的 父 进 程 ID 将 是 创建 它 的 父 进程 ， 
而 不 是 init 进 程 (进程 ID 1) 。 

执行 图 8-8 程 序 得 到 : 


$ ./a.out 


$ second child, parent pid = 1 
注意 ， 当 原先 的 进程 〈 也 就 是 exec 本 程序 的 进程 ) 终止 时 ，shell 打 
印 其 提示 符 ， 这 在 第 二 个 子 进程 打印 其 父 进程 ID 之 前 。 


8.7 waitid 


Single UNIX Specification 包 括 了 另 一 个 取得 进程 终止 状态 的 函数 一 
waitid， 此 函数 类 似 于 waitpid， 但 提供 了 更 多 的 灵活 性 。 

#include <sys/wait.h> 

int waitid(idtype_t idtype, id_t id, siginfo_t *infop, int options); 

返回 值 : Ak, allo; AE, we- 

与 waitpid 相似 ，waitid 允许 一 个 进程 指定 要 等 待 的 子 进程 。 但 它 
使 用 两 个 单独 的 参数 表示 要 等 每 的 子 进程 所 属 的 类 型 ， 而 不 十 将 此 与 
进程 ID 或 进程 组 ID 组 合成 一 个 参数 。id 参 数 的 作用 与 idtype 的 值 相关 。 
该 函数 支持 的 idtype 类 型 列 在 图 8-9 中 。 


等 待 一 特定 进程 ，id 包含 要 等 待 子 进程 的 进程 ID 


等 待 一 特定 进程 组 中 的 任 一 子 进程 : 这 包含 要 等 待 子 进程 的 进程 组 ID 
等 待 任 一 子 进程 ， 忽略 id 


图 8-9 waitid 的 idtype 常量 
options 参数 是 图 8-10 中 各 标志 的 按 位 或 运算 。 这 些 标志 指示 调用 者 关注 哪些 状态 变化 。 


等 待 一 进程 ， 它 以 前 曾 被 停止 ， 此 后 又 已 继续 ， 但 其 状态 尚未 报告 


APERIRI 


如 无 可 用 的 子 进程 退出 状态 ， 立 即 返 回 而 非 阻塞 

WNOWAIT 不 破坏 子 进程 退出 状态 。 该 子 进程 退出 状态 可 由 后 续 的 wait. waitid Bk waitpid 
调用 取得 

等 待 一 进程 ， 它 已 经 停止 ， 但 其 状态 尚未 报告 


图 8-10 waitid 的 options 常 量 

WCONTINUED 、WEXITED 或 WwWSTOPPED 这 3 个 常量 之 一 必须 在 
options 参 数 中 指定 。 

infop 参 数 是 指向 siginfo 结 构 的 指针 。 该 结构 包含 了 造成 子 进程 状 
态 改变 有 关 信 和 号 的 详细 信息 。10.14 节 将 进一步 讨论 siginfo 结 构 。 


本 书 讨论 的 4 种 平台 中 ，Linux 3.2.0 ` Mac OS X 10.6.8 和 Solaris 10 
支持 waitid。 但 要 注意 的 是 ，Mac OS X 10.6.8 并 没有 设置 siginfo 结 构 中 
的 所 有 信息 。 


8.8 wait3Zlwait4 


大 多 数 UNIX 系 统 实现 提供 了 另外 两 个 画 数 wait3 和 wait4。 历 史 
上 ， 这 两 个 函数 是 从 UNIX 系 统 的 BSD 分 支 延 袭 下 来 的 。 它 们 提供 的 功 
能 比 POSIX.1 函 数 wait、waitpid 和 waitid 所 提供 功能 的 要 多 一 个 ， 这 与 附 
加 参数 有 天。 该 参数 允许 内 核 返回 由 终止 进程 及 其 所 有 子 进 程 使 用 的 

#include <sys/types.h> 

#include <sys/wait.h> 

#include <sys/time.h> 

#include <sys/resource.h> 

pid t wait3(int *statloc, int options, struct rusage *rusage); 

pid_t wait4(pid_t pid, int *statloc, int options, struct rusage *rusage); 

两 个 函数 返回 值 : ARH, RED; Hite, wel- 

资源 统计 信息 包括 用 户 CPU 时 间 辟 量 、 系 统 CPU 时 间 总 量 、 缺 页 
次 数 、 接 收 到 信号 的 次 数 等 。 有 关 细 节 请 参阅 getrusage(2) 手 册页 (这 
种 资源 信息 与 7.11 节 中 所 述 的 资源 限制 不 同 ) 。 图 8-11 列 出 了 各 个 wait 
KAT NER 0 


Free Linux MacOSX Solaris 
POSIX] BSD 8.0 3.2.0 10.6.8 10 


wait 
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wait3 
wait4 


图 8-11 不 同系 统 上 各 个 wait 函 数 所 文 持 的 参数 


Single UNIX Specification B*] 5 #4 hie A £1 15 wait3 ER Zt » TE SUSv2 
中 ，wait3 被 移 到 了 遗留 目录 下 ， 在 SUSv3 中 ， 则 删 去 了 wait3。 


8.9 RAH 


当 多 个 进程 都 企图 对 共享 数据 进行 某 种 处 理 ， 而 最 后 的 结果 又 取 
决 于 进程 运行 的 顺序 时 ， 我 们 认为 发 生 了 竞争 条 件 (race condition) ° 
如 有 果 在 fork 之 后 的 某 种 逻辑 显 式 或 隐 式 地 依赖 于 在 fork 之 后 是 父 进程 
先 运 行 还 是 子 进 程 先 运 行 ， 那 么 fork 画 数 就 会 是 竞争 条 件 活 跃 的 滋生 
地 。 通 常 ， 我 们 不 能 预料 哪 一 个 进程 先 运行 。 即 使 我 们 知道 哪 一 个 进 
程 移 运行 ， 在 该 进程 开始 运行 后 所 发 生 的 事情 也 依赖 于 系统 负载 以 及 
内 核 的 调度 算法 。 

在 图 8-8 程 序 中 ， 当 第 二 个 子 进程 打印 其 父 进程 ID 时 ， 我 们 看 到 了 
一 个 潜在 的 竞争 条 件 。 如 果 第 二 个 子 进程 在 第 一 个 子 进程 之 前 运行 ， 
则 其 父 进 程 将 会 是 第 一 个 子 进程 。 但 是 ， 如 果 第 一 个 子 进 程 先 运行 ， 
并 有 足够 的 时 间 到 达 并 执行 exit， 则 第 二 个 子 进程 的 父 进程 就 是 init。 即 
使 在 程序 中 调用 sleep ， 也 不 能 保证 什么 。 如 果 系 统 负载 很 重 ， 那 么 在 
sleep 返 回 之 后 、 第 一 个 子 进程 得 到 机 会 运行 之 前 ， 第 二 个 子 进 程 可 能 
恢复 运行 。 这 种 形式 的 问题 很 难 调试 ， 因 为 在 大 部 分 时 间 ， 这 种 问题 
并 不 出 现 。 
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的 一 个 。 如 果 一 个 进程 要 等 待 其 父 进程 终止 《如 图 8-8 程 序 中 一 样 ) ， 
则 可 使 用 下 列 形式 的 循环 : 

while(getppid() != 1) 

sleep(1); 

这 种 形式 的 循环 称 为 轮 询 (poling) ， 它 的 问题 是 浪费 了 CPU 时 
间 ， 因 为 调用 者 每 隔 1 s 都 被 唤醒 ， 然 后 进行 条 件 测试 。 

为 了 避免 竞争 条 件 和 轮 询 ， 在 多 个 进程 之 间 需 要 有 某 种 形式 的 信 
号 发 送 和 接收 的 方法 。 在 UNIX 中 可 以 使 用 信号 机 制 ， 在 10.16 万 将 说 
明 它 在 解决 此 方面 问题 的 一 种 用 法 。 各 种 形式 的 进程 间 通 信 (IPC) 也 
可 使 用 ， 在 第 15 章 和 第 17 章 将 对 此 进行 讨论 。 

在 父 进程 和 子 进 程 的 关系 中 ， 稍 各 出 现下 述 情 况 。 在 fork 之 后 ， 父 
进程 和 子 进程 都 有 一 些 事情 要 做 。 例 如 ， 父 进程 可 能 要 用 子 进 程 ID 更 
新 日 志文 件 中 的 一 个 记录 ， 而 子 进程 则 可 能 要 为 父 进 程 创建 一 个 文 
件 。 在 本 例 中 ， 要 求 每 个 进程 在 执行 完 它 的 一 套 初 始 化 操作 后 要 通知 
对 方 ， 并 且 在 继续 运行 之 前 ， 要 等 每 妨 一 方 完成 其 初始 化 操作 。 这 种 
情况 可 以 用 代码 摘 述 如 下 : 

#include "apue.h" 

TELL_WAIT(); /* set things up for TELL. xxx & WAIT. xxx*/ 

if ((pid = fork()) « 0) 1 


err sys("fork error"); 


} else if (pid == 0) { /* child*/ 
/* child does whatever is necessary ...*/ 
TELL_PARENT(getppid()); /* tell parent we're done*/ 
WAIT PARENT(); /* and wait for 


parent*//* and the child continues on its way ...*/ 
exit(0); 


} 


/* parent does whatever is necessary ...*/ 


TELL_CHILD(pid); /* tell child we're done*/ 
WAIT. CHILD(); /* and wait for child*/ 
/* and the parent continues on its way ...*/ 

exit(0); 


假定 在 头 文件 apue.h 中 定义 了 需要 使 用 的 各 个 变量 。5 个 例 程 
TELLWAIT ` TELL PARENT ` TELL CHILD ` WAIT PARENT 以 及 
WAIT CHILD"[ Le, th Al ERZ © 

在 后 面 几 章 中 会 说 明 实 现 这 些 TELL 和 WAIT 例 程 的 不 同方 法 : 
10.16 节 中 说 明 使 用 信号 的 一 种 实现 ， 图 15-7 程 序 说 明 使 用 管道 的 一 种 
实现 。 下 面 先 看 一 个 使 用 这 5 个 例 程 的 实例 。 

实例 

图 8-12 程 序 输 出 两 个 字符 串 : 一 个 由 子 进程 输出 ， 另 一 个 由 父 进程 
输出 。 因 为 输出 依赖 于 内 核 使 这 两 个 进程 运行 的 顺序 及 每 个 进程 运行 
的 时 间 长 度 ， 所 以 该 程序 包含 了 一 个 竞争 条 件 。 


#include "apue.h" 


static void charatatime(char *); 


int 
main (void) 
( 
pid t pid; 


if ((pid = fork()) < 0) { 
err sys("fork error"); 
) else if (pid == 0) { 


charatatime ("output from child\n") 
} else { 
charatatime ("output from parent\n"); 
} 
exit (0); 
} 


static void 
charatatime(char *str) 


{ 


char *ptr; 

int c; 

setbuf(stdout, NULL); /* set unbuffered */ 
for (ptr = str; (c = *ptr++) = 0; ) 


putc(c, stdout); 


18-12 带 有 竞争 条 件 的 程序 

在 程序 中 将 标准 输出 设置 为 不 剖 缓 冲 的 ， 于 是 每 个 字符 输出 都 需 
调用 一 次 write。 本 例 的 目的 是 使 内 核能 尽 可 能 多 次 地 在 两 个 进程 之 间 
进行 切换 ， 以 便 演示 苋 争 条 件 。 (如 末 不 这 样 做 ， 可 能 也 就 决 不 会 见 
到 下 面 所 示 的 输出 。 没 有 看 到 具有 错误 的 输出 并 不 意味 着 竞争 条 件 不 
存在 ， 这 只 是 意味 着 在 此 特定 的 系统 上 未 能 见 到 它 。) 下 面 的 实际 输 
出 说 明 该 程序 的 运行 结果 是 会 改变 的 。 


$ ./a.out 


ooutput from child 
utput from parent 
$ /a.out 


ooutput from child 


utput from parent 
$ /a.out 
output from child 


output from parent 
(eccAls-12 Wty, GER DERITELLTIWAITENZE, Teen T B 
8-13 中 的 程序 。 行 首 标 以 + 号 的 行 是 新 增加 的 行 。 


Static void charatatime(char *); 


int 
main (void) 
{ 
pid t pid; 


* TELL WAIT(); 


if ((pid = fork()) « 0) { 
err sys("fork error"); 

else if (pid == 0) { 

+ WAIT_PARENT () ; /* parent goes first*/ 
charatatime ("output from child\n"); 

eise. { 
charatatime ("output from parent\n"); 

+ TELL CHILD (pid); 


exit(0); 
) 


static void 
charatatime (char *str) 


{ 


char *ptf; 

int Gr 

setbuf (stdout, NULL); /* set unbuffered*/ 
for (ptr = str; (c = *ptr++) != 0; ) 


putc(c, stdout); 


~ 


图 8-13 修改 图 8-12 程 序 以 避免 竟 争 条 件 
运行 此 程序 则 能 得 到 所 预期 的 输出 一 两 个 进程 的 输出 不 再 交叉 混 


图 8-13 中 的 程序 是 使 父 进程 先 运 行 。 如 果 将 fork 之 后 的 行 改 成 : 
else if (pid == 0) { 

charatatime(" output from child Wn"); 

TELL PARENT(getppid()); 


} else 1 
WAIT CHILD(Q); /* child goes first */ 
charatatime(" output from parent\n"); 

j 
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8.10 exec 


8.3 市 曾 提 及 用 fork 函 数 创建 新 的 子 进程 后 ， 子 进程 往往 要 调用 一 
种 exec 范 数 以 执行 男 一 个 程序 。 当 进程 调用 一 种 exec 范 数 时 ， 该 进程 执 
行 的 程序 完全 替换 为 新 程序 ， 而 新 程序 则 从 其 main 函 数 开始 执行 。 
为 调用 exec 并 不 创建 新 进程 ， 所 以 前 后 的 进程 ID 并 未 改变 。exec 只 是 用 
磁盘 上 的 一 个 新 程序 替换 了 当前 进程 的 正文 段 、 数 据 段 、 扒 段 和 栈 
段 。 

7 FAS |e] exec ER ax A] GEC AR, ET) AS SRST PR exec, FX 
fl 18] DA Fk 7 TS ERIE 0 1k exec En ZU FEUNIX A tas PEPE 
制 原 语 更 加 完善 。 用 fork 可 以 创建 新 进程 ， 用 exec 可 以 初始 执行 新 的 程 
序 。exit 函 数 和 wait 函 数 处 理 终 止 和 等 竺 终止 。 这 些 是 我 们 需要 的 基本 
的 进程 控制 原 语 。 在 后 面 各 下 中 将 使 用 这 些 原 语 构造 另外 一 些 如 popen 
和 system 之 类 的 函数 。 

#include <unistd.h> 


int execl(const char *pathname, const char *arg0, ... /* (char *)0 */ ); 


int execv(const char *pathname, char *const argv[]); 
int execle(const char *pathname, const char *arg0, ... 
/* (char *)0, char *const envp[] */ ); 
int execve(const char *pathname, char *const argv[], char *const 
envpl[]); 
int execlp(const char *filename, const char *arg0, ... /* (char *)0 */ ); 
int execvp(const char *filename, char *const argv[]); 
int fexecve(int fd, char *const argv[], char *const envp[]); 
7 个 函数 返回 值 ， 若 出 错 ， 返 回 -1， 若 成 功 ， 不 返回 
函数 之 间 的 第 一 个 区 别 是 前 4 个 函数 取 路 径 名 作为 参数 ， 后 两 
^s ER tp Ig — T BOCTPE USE EAN BN ^ Ste 
定 filename 作 为 参数 时 : 
如果 fiename 中 包含 /， 则 就 将 其 视 为 路 径 名 ; 
否则 就 按 PATH 环 境 变 量 ， 在 它 所 指定 的 各 目录 中 搜寻 可 执行 文 


件 。 
PATH 变量 包含 了 一 张 目录 表 〈 称 为 路 径 前 缀 ) ， 目 录 之 间 用 冒号 
(:) 分 隔 。 下 列 name=value 环 境 字 符 串 指定 在 4 个 目录 中 进行 搜 
索 o 
PATH-/bin:/usr/bin:/usr/local/bin:. 
最 后 的 路 径 前 级 .表示 当前 目录 。 ( 零 长 前 缀 也 表示 当前 目录 。 在 
value 的 开始 处 可 用 :表示 ， 在 行 中 间 则 要 用 :: 表 示 ， 在 行 尾 以 :表示 。) 
出 于 安全 性 方面 的 考虑 ， 有 些 人 要 求 在 搜索 路 径 中 决 不 要 包括 当 
前 目录 。 请 参见 Garfinkel 等 [2003] ° 
如 果 execlp 或 execvp 使 用 路 径 前 级 中 的 一 个 找到 了 一 个 可 执行 文 
件 ， 但 是 该 文件 不 是 由 连接 编辑 器 产生 的 机 器 可 执行 文件 ， 则 就 认为 
该 文件 是 一 个 shell 脚 本 ， 于 是 试 着 调用 /bin/sh， 并 以 该 flename 作 为 
shell 的 输入 。 


fexecve EX ŽE S, T FREMRI IATE, TUE TROU US HI ERROR 
完成 这 项 工作 。 调 用 进程 可 以 使 用 文件 描述 符 验证 所 需要 的 文件 并 且 
无 竞争 地 执行 该 文件 。 和 否则， 拥有 特权 的 恶意 用 户 就 可 以 在 找到 文件 
位 置 并 且 验 证 之 后 ， 但 在 调用 进程 执行 该 文件 之 前 替换 可 执行 文件 

(或 可 执行 文件 的 部 分 路 径 ) ， 有 具体 可 参考 3.3TTOCTTOU 的 讨论 。 

第 二 个 区 别 与 参数 表 的 传递 有 关 (1 表示 列表 list，v 表 示 矢 量 
vector) ° EXZX execl、execlp 和 execle 要 求 将 新 程序 的 每 个 命令 行 参 数 
都 说 明 为 一 个 单独 的 参数 。 这 种 参数 表 以 空 指 针 结尾 。 对 于 另外 4 个 画 
数 (execv、execvp、execve 和 fexecve) ， 则 应 先 构造 一 个 指向 各 参数 
的 指针 数组 ， 然 后 将 该 数组 地 址 作为 这 4 个 函数 的 参数 © 

在 使 用 ISO C 原 型 之 前 ， 对 execl、execle 和 execlp 三 个 函数 表示 命令 
行 参数 的 一 般 方 法 是 : 

char *arg0, char *arg1, ..., char *argn, (char *)0 

这 种 语法 显 式 地 说 明了 最 后 一 个 命令 行 参 数 之 后 跟 了 一 个 空 指 
针 。 如 采用 香 量 0 来 表示 一 个 空 指 针 ， 则 必须 将 它 强制 转换 为 一 个 指 
针 ; 否则 它 将 被 解释 为 整 型 参数 。 如 果 一 个 整 型 数 的 长 度 与 char * 的 长 
度 不 同 ， 那 么 exec 芳 数 的 实际 参数 将 出 错 。 

最 后 一 个 区 别 与 向 新 程序 传递 环境 表 相 关 。 以 e 结 尾 的 3 个 函数 

(execle ` execvefilfexecve) 可 以 传递 一 个 指向 环境 字符 串 指针 数组 的 
指针 。 其 他 4 个 函数 则 使 用 调用 进程 中 的 environ 变 量 为 新 程序 复制 现 有 
的 环境 (回忆 7.9 节 及 图 7-8 中 对 环境 字符 串 的 讨论 。 其 中 曾 提 及 如 果 系 
统 文 持 setenv 和 putenv 这 样 的 函数 ， 则 可 更 改 当 前 环境 和 后 面 生成 的 子 
进程 的 环境 ， 但 不 能 影响 父 进程 的 环境 ) 。 通 常 ， 一 个 进程 允许 将 其 
环境 传播 给 其 子 进 程 ， 但 有 时 也 有 这 种 情况 ， 进 程 想 要 为 子 进 程 指定 
某 一 个 确定 的 环境 。 例 如 ， 在 初始 化 一 个 新 登录 的 shell 时 ，login 程 序 
通常 创建 一 个 只 定义 少数 几 个 变量 的 特殊 环境 ， 而 在 我 们 登录 时 ， 可 
以 通过 shell 启 动 文 件 ， 将 其 他 变量 加 到 环境 中 。 


在 使 用 ISO C 原 型 之 前 ，execle 的 参数 是 : 

char *pathname, char *arg0, ..., char *argn, (char *)0, char *envp[] 

从 中 可 见 ， 最 后 一 个 参数 是 指向 环境 字符 捉 的 各 字符 指针 构成 的 
数组 的 指针 。 而 在 ISO C 原 型 中 ， 所 有 命令 行 参数 、 空 指针 和 envp 指 针 
都 用 省 略 号 (...) 表示 。 

这 7 个 exec 函 数 的 参数 很 难 记忆 。 画 数 名 中 的 字符 会 给 我 们 一 些 帮 
助 。 字 母 p 表 示 该 本 数 取 fename 作 为 参数 ， 并 且 用 PATH 环境 变量 寻找 
可 执行 文件 。 字 和 母 ] 表 示 该 画 数 取 一 个 参数 表 ， 它 与 字母 v 互 不 。v 表 示 
该 函数 取 一 个 argv[ RE ma, KhteRRIZ A envpi ] 数 组 ， 而 
不 使 用 当前 环境 。 图 8-14 显 示 了 这 7 个 函数 之 间 的 区 别 。 


函数 pathname filename f argv[] environ envp [ ] 


execl 
execlp 
execle 
execv 
execvp 
execve 
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每 个 系统 对 参数 表 和 环境 表 的 总 长 度 都 有 一 个 限制 。 在 2.5.2 节 和 
图 2-8 中 ， 这 种 限制 是 由 ARG_MAX 给 出 的 。 在 POSIX.1 系 统 中 ， 此 值 
至 少 是 4 096 字 攻 。 当 使 用 shell 的 文件 名 扩充 功能 产生 一 个 文件 名 列表 
时 ， 可 能 会 受到 此 值 的 限制 。 例 如 ， 命 令 

grep getrlimit /usr/share/man/*/* 

在 某 些 系统 上 可 能 产生 如 下 形式 的 shell 错 误 : 

Argument list too long 

由 于 历史 原因 ，System V 中 此 限制 值 是 5 120 字 和 。 早 期 BSD 系 统 
的 此 限制 值 是 20 480 字 节 。 当 前 系统 中 ， 此 限制 值 要 大 得 多 。 (如 图 2- 


14 所 示 的 程序 的 输出 ， 图 2-15 总 结 列 出 了 限制 值 。) 

为 了 摆脱 对 参数 表 长 度 的 限制 ， 我 们 可 以 使 用 xargs( TD) 命令 ， 将 长 
参数 表 断 开 成 儿 部 分 。 为 了 寻找 在 我 们 所 用 系统 手册 页 中 的 getrlimit， 
我 们 可 以 用 

find /usr/share/man -type f -print | xargs grep getrlimit 

如 果 所 用 的 系统 手册 页 是 压缩 过 的 ， 则 可 使 用 

find /usr/share/man -type f -print | xargs bzgrep getrlimit 

对 于 find 命 令 ， 我 们 使 用 选项 -typef， 以 限制 输出 列表 只 包含 普通 
文件 。 这 样 做 的 原因 是 ， grep 命 令 不 能 在 日 录 中 进行 模式 搜索 ， 我 们 
也 想 避 人 免 不 必 要 的 出 错 消 轧 。 

前 面 曾 提 及 ， 在 执行 exec 后 ， 进 程 ID 没有 改变 。 但 新 程序 从 调用 
进程 继承 了 的 下 列 属性 : 

。 进程 ID 和 父 进程 ID 

“实际 用 户 ID 和 实际 组 ID 

“附属 组 ID 

“进程 组 ID 

“会 话 ID 

“控制 终端 

«Ir Ep fea) AR A ERST TR] 

“当前 工作 目录 

-TR HS 

.文件 模式 创建 屏蔽 字 

“文件 锁 

“进程 信号 屏蔽 

“未 处 理 信和 号 

“资源 限制 

“ice 值 (遵循 XSI 的 系统 ， 见 8.16 节 ) 


*tms utime ^ tms stime ` tms cutimeLÀ tms cstimef& 

对 打开 文件 的 处 理 与 每 个 描述 符 的 执行 时 关闭 (close-on-exec) 标 
志 值 有 关 。 回 忆 图 3-7 以 及 3.14 节 中 对 FD_CLOEXEC 标 志 的 说 明 ， 进 程 
中 每 个 打开 描述 符 都 有 一 个 执行 时 关闭 标志 。 若 设置 了 此 标志 ， 则 在 
执行 exec 时 关闭 该 摘 述 符 ， 否 则 该 摘 述 符 仍 打开 。 除 非特 地 用 fentl 设 
置 了 该 执行 时 关闭 标志 ， 否 则 系统 的 默认 操作 是 在 exec 后 仍 保持 这 种 摘 
述 符 打开 。 

POSIX.1 明 确 要 求 在 exec 时 关闭 打开 目录 流 〈 见 4.22 节 中 所 述 的 
opendir 函 数 ) 。 这 通常 是 由 opendir 函数 实现 的 ， 它 调用 fentl 函数 为 
对 应 于 打开 目录 流 的 描述 符 设 置 执行 时 关闭 标志 。 

注意 ， 在 exec 前 后 实际 用 户 ID 和 实际 组 ID 保持 不 变 ， 而 有 歼 ID 是 
否 改变 则 取决 于 所 执行 程序 文件 的 设置 用 户 ID 位 和 设置 组 ID 位 是 否 设 
置 。 如 果 新 程序 的 设置 用 户 ID 位 已 设置 ， 则 有 效用 户 ID 变 成 程序 文件 
所 有 者 的 ID; 否则 有 效用 户 ID 不 变 。 对 组 ID 的 处 理 方 式 与 此 相同 。 

在 很 多 UNIX 实 现 中 ， 这 7 个 函数 中 只 有 execve 是 内 核 的 系统 调用 。 
男 外 6 个 只 是 库 函 数 ， 它 们 最 终 都 要 调用 该 系统 调用 。 这 7 个 画 数 之 间 
的 天 系 示 于 图 8-15 中 。 


execlp | | execl | execle | 

T 

| Mtr argv 建立 argv 建立 argv 

' Y 

尝试 每 个 使 用 execve 
— PATH Wi - uw | environ 系统 调用 ) 

build path from 
/proc/self/fd 
alias 


fexecve 
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在 这 种 安排 中 ， 库 函数 execlp 和 execvp 使 用 PATH 环境 变量 ， 查 
找 第 一 个 包含 名 为 flename 的 可 执行 文件 的 路 径 名 前 缀 。fexecve 库 函数 
使 用 /proc 把 文件 描述 符 参 数 转换 成 路 径 名 ，execve 用 该 路 径 名 去 执行 程 
序 o 

这 描述 了 在 FreeBSD 8.0 和 Linux 3.2.0 中 是 如 何 实现 fexecve 的 。 其 
他 系统 采用 的 方法 可 能 不 同 。 例 如 ， 没 有 /proc 和 /dev/fd 的 系统 可 能 把 
fexecve 实 现 为 系统 调用 ， 把 文件 描述 符 参 数 转 换 成 im 点 指针 ， 把 
execve 实 现 为 系统 调用 ， 把 路 径 名 参数 转换 成 i 让 点 指针 ， 然 后 把 execve 
和 fexecve 中 和 列 余 的 exec 公 共 代 码 放 到 单独 的 函数 中 ， 调 用 该 芳 数 时 传 
入 执行 文件 的 i 节点 指针 。 

实例 

图 8-16 中 的 程序 演示 了 exec 函 数 。 


#include "apue.h" 
#include <sys/wait.h> 


char *env init[] = ( "USER-unknown", "PATH-/tmp", NULL ); 


int 
main (void) 
{ 
pid t pid; 


if ((pid = fork()) < 0) { 
err sys("fork error"); 

) else if (pid == 0) { /* specify pathname, specify environment */ 
if (execle("/home/sar/bin/echoall", "echoall", "myargl", 


"MY ARG2", (char *)0, env init) « 0) 


err sys("execle error"); 


) 


if (waitpid(pid, NULL, 0) < 0) 
err sys("wait error"); 
if ((pid = fork()) « 0) { 
err sys("fork error"); 
) else if (pid == 0) { /* specify filename, inherit environment */ 


if (execlp("echoall", "echoall", "only 1 arg", (char *)0) < 0) 


err sys("execlp error"); 


exit(0); 


18-16 exec ERASE fil] 


在 该 程序 中 先 调用 execle， 它 要 求 一 个 路 径 名 和 一 个 特定 的 环境 。 
下 一 个 调用 的 是 execlp， 它 用 一 个 文件 名 ， 并 将 调用 者 的 环境 传送 给 新 
程序 。execlp 在 这 里 能 够 工作 是 因为 目录 /home/sar/bin 是 当前 路 径 前 组 
之 一 。 注 意 ， 我 们 将 第 一 个 参数 (新 程序 中 的 argv[0]) 设置 为 路 径 名 
的 文件 名 分 量 。 某 些 shell 将 此 参数 设置 为 完全 的 路 径 名 。 这 只 是 一 个 
惯例 。 我 们 可 将 argv[0] 设 置 为 任何 字符 串 。 当 login 命 令 执行 shell 时 就 是 
这 样 做 的 。 在 执行 shell 之 前 ，login 在 argv[0] 之 前 加 一 个 /作为 前 级 ， 这 
问 shell 指 明 它 是 作为 登录 shell 补 调用 的 。 登 录 shell 将 执行 局 动 配置 文件 

(start-up profile) 命令 ， 而 非 登 录 shell 则 不 会 执行 这 些 命 令 。 

图 8-16 中 的 程序 要 执行 两 次 的 echoall 程 序 如 图 8-17 所 示 。 这 是 一 个 

很 普通 的 程序 ， 它 回 显 所 有 命令 行 参 数 及 全 部 环境 表 。 


finclude "apue.h" 


int 
main(int argc, char *argv[]) 
{ 
int i; 
char **5tr. 
extern char  **environ; 


for (i = 0; i < argc; i++) /* echo all command-line args */ 
printf ("argv[%d]: s\n", i, argv[i]); 
for (ptr = environ; *ptr != 0; ptrt+t) /* and all env strings */ 


printf("$sMn", *ptr); 


exit (0); 


图 8-17 回 显 所 有 命令 行 参数 和 所 有 环境 字符 串 
执行 图 8-16 中 的 程序 得 到 |: 


$ ./a.out 


argv[0]: echoall 

argv[1]: myarg1 

argv[2]: MY ARG2 

USER-unknown 

PATH-/tmp 

argv[0]: echoall 

$ argv[1]: only 1 arg 

USER-sar 

LOGNAME=sar 

SHELL=/bin/bash 

还 有 47 行 没有 列 出 

HOME=/home/sar 

TER, shell 提示 符 出 现在 第 二 个 exec 打印 argv[0] 之 前 。 这 是 因为 
父 进程 并 不 等 待 该 子 进程 结 


8.11 ID 组 ID 


在 UNIX 系 统 中 ， 特 权 (如 能 改变 当前 日 期 的 表示 法 ) 以 及 访问 控 
制 (如 能 否 读 、 写 一 个 特定 文件 ) ， 是 基于 用 户 ID 和 组 ID 的 。 当 程序 
需要 增加 特权 ， 或 需要 访问 当前 并 不 允许 访问 的 资源 时 ， 我 们 需要 更 
换 自 己 的 用 户 ID 或 组 ID， 使 得 新 ID 具有 合适 的 特权 或 访问 权限 。 与 此 
类 似 ， 当 程序 需要 降低 其 特权 或 阻止 对 某 些 资源 的 访问 时 ， 也 需要 更 
换 用 户 ID 或 组 ID， 新 ID 不 具有 相应 特权 或 访问 这 些 资源 的 能 

一 般 而 言 ， 在 设计 应 用 时 ， 我 们 总 是 试图 使 用 最 小 特权 (least 
privilege) 模型 。 依 照 此 模型 ， 我 们 的 程序 应 当 只 具有 为 完成 给 定 任务 
所 需 的 最 小 特权 。 这 降低 了 由 恶意 用 户 试图 哄骗 我 们 的 程序 以 未 预料 
的 方式 使 用 特权 造成 的 安全 性 风险 。 

可 以 用 setuid 函 数 设置 实际 用 户 ID 和 有 效用 户 ID 。 与 此 类 似 ， 可 以 
用 setgid 函 数 设置 实际 组 ID 和 有 效 组 ID © 


#include <unistd.h>int setuid(uid t uid); 


int setgid(gid t gid); 
两 个 函数 返回 值 : ni, Reo; AH, we- 

天 于 谁 能 更 改 D 有 若干 规则 。 现 在 先 考 虑 更改 用 户 有 D 的 规则 (XX 
于 用 户 ID 我 们 所 说 明 的 一 切 都 适用 于 组 ID) 。 

(1) 若 进 程 具有 超级 用 户 特权 ， 则 setuid 函 数 将 实际 用 户 ID、 有 
效用 户 ID 以 及 保存 的 设置 用 户 ID (saved set-user-ID) 设置 为 uid ° 

(2) 大 进程 没有 超级 用 户 特权 ， 但 是 uid 等 于 实际 用 户 ID 或 保存 的 
设置 用 户 ID， 则 setuid 只 将 有 效用 户 ID 设 置 为 uid。 不 更 改 实际 用 户 ID 和 
傈 存 的 设置 用 户 ID。 

(3) 如 果 上 面 两 个 条 件 都 不 满足 ， 则 ermo 设 置 为 EPERM， 并 返 
回 -1。 


在 此 假定 _POSIX_SAVED_IDS 为 真 。 如 果 没 有 提供 这 种 功能 ， 则 
上 面 所 说 的 关于 保存 的 设置 用 户 ID 部 分 都 无 效 。 

在 POSIX.1 2001 版 中 ， 保 存 的 名 是 强制 性 功能 。 而 在 较 早 版 本 
中 ， 它 们 是 可 选择 的 。 为 了 和 弄 清楚 某 种 实现 是 否 文 持 这 一 功能 ， 应 用 
程序 在 编译 时 可 以 测试 常量 _ POSIOX_SAVED _IDS， 或 者 在 运行 时 以 
_SC_SAVED_IDS 参 数 调 用 sysconf 范 数 。 

关于 内 核 所 维护 的 3 个 用 户 ID ， 还 要 注意 以 下 几 点 。 

(1) 只 有 超级 用 户 进程 可 以 更 改 实际 用 户 ID。 通 常 ， 实 际 用 户 ID 
是 在 用 户 登 录 时 ， 由 login(1) 程 序 设置 的 ， 而 且 决 不 会 改变 它 。 因 为 
login 是 一 个 超级 用 户 进程 ， 当 它 调 用 setuid 时 ， 设 置 所 有 3 个 用 户 ID。 

(2) 仅 当 对 程序 文件 设置 了 设置 用 户 ID 位 时 ，exec 函 数 才 设 置 有 
效用 户 ID。 如 果 设 置 用 户 ID 位 没有 设置 ，exec 函 数 不 会 改变 有 效用 户 
ID， 而 将 维持 其 现 有 值 。 任 何 时 候 都 可 以 调用 setuid， 将 有 效用 户 ID 设 
置 为 实际 用 户 ID 或 保存 的 设置 用 户 ID。 自 然 地 ， 不 能 将 有 效用 户 ID 设 
置 为 任 一 随机 值 。 

(3) 保存 的 设置 用 户 ID 是 由 exec 复 制 有 效用 户 ID 而 得 到 的 。 如 果 
设置 了 文件 的 设置 用 户 ID 位 ， 则 在 exec 根 据 文 件 的 用 户 ID 设置 了 进程 
的 有 效用 户 ID 以 后 ， 这 个 副本 就 被 保存 起 来 了 。 

图 8-18 总 结 了 更 改 这 3 个 用 户 ID 的 不 同方 法 。 


setuid (uid) 


设置 用 户 ID 位 关闭 设置 用 户 ID 位 打开 超级 用 户 非特 权 用 户 


实际 用 户 ID \ 变 不 变 | 设 为 uid 

有 效用 户 ID ` 变 设置 为 程序 文件 的 用 户 ID WA uid 

保存 的 设置 用 户 ID 效用 户 ID 复制 “| 从 有 效用 户 ID 复制 设 为 uid 
图 8-18 更 改 3 个 用 户 ID 的 不 同方 法 
注意 ，8.2 节 中 所 述 的 getuid 和 geteuid 函 数 只 能 获得 实际 用 户 ID 和 有 
效用 户 ID 的 当前 值 。 我 们 没有 可 移植 的 方法 去 获得 保存 的 设置 用 户 ID 


的 当前 值 。 

FreeBSD 8.0 和 LINUX 3.2.02 ££ T getresuid Fil getresgid ER X, €i] 
可 以 分 别 用 于 获取 保存 的 设置 用 户 ID 和 保存 的 设置 组 ID。 

1.， 画 数 setreuid 和 setregid 

历史 上 ，BSD 文 持 setreuid 函 数 ， 其 功能 是 交换 实际 用 户 ID 和 有 歼 
用 户 ID 的 值 。 

#include <unistd.h> 

int setreuid(uid_t ruid, uid_t euid); 

int setregid(gid_t rgid, gid_t egid); 

两 个 图 数 返回 值 : REX), eo; 者 出 错 ， 返 回 -1 

如 知 其 中 任 一 参数 的 值 为 -1， 则 表示 相应 的 ID 应 当 保 持 不 变 。 

规则 很 简单 : 一 个 非特 权 用 户 总 能 交换 实际 用 户 ID 和 有 效用 户 
ID。 这 就 允许 一 个 设置 用 户 ID 程序 交换 成 用 户 的 普通 权限 ， 以 后 又 可 
再 次 交换 回 设置 用 户 ID 权限 。POSIX.1 引 进 了 保存 的 设置 用 户 ID 特性 
后 ， 其 规则 也 相应 加 强 ， 它 允许 一 个 非特 权 用 户 将 其 有 效用 户 ID 设置 
为 保存 的 设置 用 户 ID 。 

seteuid 和 setregid 两 个 函数 都 是 Single UNIX Specification 的 XSI 扩 - 
展 。 因 此 ， 可 以 期 望 所 有 UNIX 系 统 实现 都 将 对 它们 提供 文 持 。 

4.3BSD 并 没有 上 面 所 说 的 保存 的 设置 用 户 IDP 特 性 ， 而 是 使 用 
setreuid 和 setregid 来 代替 。 这 束 允 许 一 个 非特 权 用 户 交 换 这 两 个 用 户 ID 
的 值 ， 但 是 要 注意 ， 当 使 用 此 特性 的 程序 生成 shell 进 程 时 ， 它 必须 在 
exec 之 前 先 将 实际 用 户 ID 设 置 为 普通 用 户 ID。 如 果 不 这 样 做 的 话 ， 实 
际 用 户 ID 就 可 能 是 具有 特权 的 (由 setreuid 的 交换 操作 造成 ， 然 后 
shell 进 程 可 能 会 调用 setreuid 交 换 两 个 用 户 ID 值 并 取得 更 多 权限 。 作 为 
一 个 保护 性 的 解决 这 一 问题 的 编程 措施 ， 程 序 在 子 进程 调用 exec 之 前 ， 
将 子 进 程 的 实际 用 户 ID 和 有 效用 户 ID 都 设置 成 普通 用 户 ID 。 

2 .函数 seteuid 和 setegid 


POIX.1 £, & T PY ^ & Zi seteuid Fil setegid ° E M] X 1 F setuid Fil 
setgid， 但 只 更 改 有 效用 户 ID 和 有 效 组 ID。 

#include <unistd.h> 

int seteuid(uid t uid); 

int setegid(gid t gid); 

PYM ESO: ERD, welo; 者 出 错 ， 返 回 -1 

一 个 非特 权 用 户 可 将 其 有 效用 户 ID 设置 为 其 实际 用 户 ID 或 其 保存 
的 设置 用 户 ID。 对 于 一 个 特权 用 户 则 可 将 有 效用 户 ID 设置 为 uid。 (这 
区 别 于 setuid 函 数 ， 它 更 改 所 有 3 个 用 户 ID 。) 

图 8-19 给 出 了 本 和 所 述 的 更 改 3 个 不 同 用 户 ID 的 各 个 函数 。 


超级 用 户 超级 用 户 超级 用 户 


setreuid(ruid, euid) setuid(uid) seteuid (uid) 


ruid 
inc Ns 


— ILI use 
实际 用 户 ID Bene 有 效用 户 ID 


yid 


uid 


保存 的 
设置 - 用 户 ID 


非特 权 的 


setreuid 


exec 


设置 用 户 ID 


非特 权 的 非特 权 的 


setuid X seteuid setuid K seteuid 


图 8-19 设置 不 同 用 户 ID 的 各 函数 


3. 组 ID 

本 章 中 所 说 明 的 一 切 都 以 类 似 方 式 适 用 于 各 个 组 ID。 附 属 组 ID 不 
5€ setgid、setregid 和 setegid 函 数 的 影 啊 。 

实例 


为 了 说 明 保存 的 设置 用 户 ID 特性 的 用 法 ， 先 观察 一 个 使 用 该 特性 
的 程序 。 我 们 所 观察 的 是 at(1) 程 序 ， 它 用 于 调度 将 来 某 个 时 刻 要 运行 
的 命令 

f£ Linux 3.2.0 上 安装 的 at 程序 的 设置 用 户 ID 是 daemon 用 户 。 在 
FreeBSD 8.0、Mac OS X 10.6.8 以 及 Solaris 10 上 安装 的 at 程序 的 设置 用 
户 ID 是 root 用 户 。 这 人 允许 at 命令 对 守护 进程 拥有 的 特权 文件 具有 写 权 
限 ， 和 守护 进程 代表 用 户 运行 at 命令 。 在 Linux 3.2.0 上 ， 程 序 是 用 atd(8) 守 
护 进程 运行 的 。 在 FreeBSD 8.0 和 Solaris 10 上， 程序 通过 cron(1M) 守 护 
进程 运行 。 在 Mac OS X 10.6.8 上 ， 程 序 通过 launchd(8) 守 护 进 程 运行 。 

为 了 防止 被 欺骗 而 运行 不 被 允许 的 命令 或 读 、 写 没有 访问 权限 的 
文件 ，at 命 令 和 最 终 代 表 用 户 运行 命令 的 守护 进程 必须 在 两 种 特权 之 间 
Hk: 用 户 特权 和 守护 进程 特权 。 下 面 列 出 了 其 工作 步骤 。 

(1) 程序 文件 是 由 root 用 户 拥 有 的 ， 并 且 其 设置 用 户 ID 位 已 设 
置 。 当 我 们 运行 此 程序 时 ， 得 到 下 列 结 

实际 用 户 ID= 我 们 的 用 户 ID (未 改变 ) 
有 效用 户 ID=root 
保存 的 设置 用 户 ID=root 

(2) at 程序 做 的 第 一 件 事 就 是 降低 特权 ， 以 用 户 特 权 运 行 。 它 调 

用 setuid 函数 把 有 效用 户 ID 设置 为 实际 用 户 ID。 此 时 得 到 : 
实际 用 户 ID= 我 们 的 用 户 ID (未 改变 ) 
有 效用 户 ID= 我 们 的 用 户 ID 
保存 设置 用 户 ID=root (未 改变 ) 
(3) at 程序 以 我 们 的 用 户 特权 运行 ， 直 到 它 需要 访问 控制 哪些 命 


令 即将 运行 ， 这 些 命令 需要 何 时 运行 的 配置 文件 时 ，at 程序 的 特权 会 
改变 。 这 些 文件 由 为 用 户 运行 命令 的 守护 进程 持 有 “。at 命 令 调用 setuid 


函数 把 有 效用 户 岂 设 为 root， 因 为 setuid 的 参数 等 于 保存 的 设置 用 户 


ID， 所 以 这 种 调用 是 许可 的 (这 就 是 为 什么 需要 保存 的 设置 用 户 ID 的 
原因 ) 。 现 在 得 到 : 
实际 用 户 ID= 我 们 的 用 户 ID (未 改变 ) 
8 3X FH P ID-root 
保存 的 设置 用 户 ID=root (RAE) 
因为 有 效用 户 ID 是 root， 文 件 访问 是 允许 的 。 
(4) 修改 文件 从 而 记录 了 将 要 运行 的 命令 以 及 它们 的 运行 时 间 以 
后 ，at 命 令 通过 调用 seteuid， 把 有 效用 户 ID 设置 为 用 户 ID， 降 低 它 的 特 
权 。 防 止 对 特权 的 误 用 。 此 时 我 们 可 以 得 到 ; 
实际 用 户 ID= 我 们 的 用 户 ID (未 改变 ) 
有 效用 户 ID= 我 们 的 用 户 ID 
保存 的 设置 用 户 ID=root (RAE) 
(5) 守护 进程 开始 用 root 特权 运行 ， 代 表 用 户 运 行 命令 ， 守 护 进 
程 调 用 fork， 子 进程 调用 setuid 将 它 的 用 户 ID 更 改 至 我 们 的 用 户 ID 。 
为 子 进程 以 root 特 权 运 行 ， 更 改 了 所 有 的 ID ， 所 以 
实际 用 户 ID= 我 们 的 用 户 ID 
有 效用 户 ID= 我 们 的 用 户 ID 
保存 的 设置 用 户 ID= 我 们 的 用 户 ID 

现在 守护 进程 可 以 安全 地 代表 我 们 执行 命令 ， 因 为 它 只 能 访问 我 
们 通 第 可 以 访问 的 文件 ， 我 们 没有 额外 的 权限 。 

以 这 种 方式 使 用 保存 的 设置 用 户 ID ， 只 有 在 需要 提升 特权 的 时 
候 ， 我 们 通过 设置 程序 文件 的 设置 用 户 ID 而 得 到 的 额外 权限 。 然 而 ， 
其 他 时 间 进 程 在 运行 时 只 具有 普通 的 权限 。 如 果 进 程 不 能 在 其 结束 部 
分 切换 回 保存 的 设置 用 户 ID ， 那 么 就 不 得 不 在 全 部 运行 时 间 都 保持 额 
外 的 权限 GRATES OT) 。 


8.12 解释 器 文件 


所 有 现今 的 UNIX 系 统 都 文 持 解 释 器 文件 (interpreter file) 。 这 种 
文件 是 文本 文件 ， 其 起 始 行 的 形式 是 : 

#! pathname [ optional-argument ] 

在 感叹 号 和 pathname 之 间 的 空格 是 可 选 的 。 最 常见 的 解释 器 文件 
以 下 列 行 开 始 : 

#! /bin/sh 

pathname 通 党 是 绝对 路 径 名 ， 对 它 不 进行 什么 特殊 的 处 理 (不 使 
用 PATH 进行 路 径 搜 索 ) 。 对 这 种 文件 的 识别 是 由 内 核 作 为 exec 系 统 调 
用 处 理 的 一 部 分 来 完成 的 。 内 核 使 调用 exec 函 数 的 进程 实际 执行 的 并 
不 是 该 解释 人 如 文件 ， 而 是 在 该 解释 絮 文 件 第 一 行 中 pathname 所 指定 的 
文件 。 一 定 要 将 解释 器 文件 (文本 文件 ， 它 以 # 开 头 ) 和 解释 器 (由 该 
解释 器 文件 第 一 行 中 的 pathname 指 定 ) 区 分 开 来 。 

很 多 系统 对 解释 器 文件 第 一 行 有 长 度 限 制 。 这 包括 刘 、pathname、 
可 选 参数 、 终 止 换 行 符 以 及 空格 数 。 

在 FreeBSD 8.0 中 ， 该 限制 是 4 097 字 节 。Linux 3.2.0 中 ， 该 限制 为 
12858 ° Mac OS X 10.6.8 中 ， 该 限制 为 513 字 节 ， 而 Solaris 10 的 限制 
是 1 024 字 节 。 

实例 

让 我 们 观察 一 个 实例 ， 从 中 可 了 解 当 被 执行 的 文件 是 个 解释 器 文 
件 时 ， 内 核 如 何 处 理 exec 

函数 的 参数 及 该 解释 器 文件 第 一 行 的 可 选 参数 。 图 8-20 中 的 程序 调 
用 exec 执 行 一 个 解释 器 文件 。 


#include "apue.h" 
#include <sys/wait.h> 


int 
main (void) 
( 
pid t pid; 


if ((pid = fork()) < 0) ( 
err sys("fork error"); 
} else if (pid == 0) { /* child */ 
if (execl("/home/sar/bin/testinterp", 
"testinterp", "myargl", "MY ARG2", (char *)0) « 0) 


err sys("execl error"); 
} 
if (waitpid(pid, NULL, 0) < 0) /* parent */ 
err_sys("waitpid error"); 
exit (0); 


图 8-20 执行 一 个 解释 器 文件 的 程序 
下 面 先 显示 要 被 执行 的 该 解释 器 文件 的 内 容 (只 有 一 行 ) ， 接 着 
是 运行 图 8-20 中 的 程序 得 到 的 结果 。 
$ cat /home/sar/bin/testinterp 


#!/home/sar/bin/echoarg foo 

$ ./a.out 

argv[0]: /home/sar/bin/echoarg 

argv[1]: foo 

argv[2]: /home/sar/bin/testinterp 

argv[3]: myarg1 

argv[4]: MY ARG2 

程序 echoarg 〈 解 释 器 ) 回 显 每 一 个 命令 行 参数 〈 它 就 是 图 7-4 中 的 
程序 ) 。 注 意 ， 当 内 核 exec 解 释 器 (/home/sar/bin/echoarg) 时 ，argv[0] 
尽 该 解释 器 的 pathname，argv[1] 古 解释 器 文件 中 的 可 选 参 数 ， 其 余 参 数 
是 pathname (/home/sar/bin/testinterp) 以 及 图 8-20 所 示 的 程序 中 调用 
execl 的 第 2 个 和 第 3 个 参数 (myarg1 和 MY ARG2) 。 调 用 execl 时 的 
argv[1] 和 argv[2] 已 右 移 了 两 个 位 置 。 注 意 ， 内 核 取 exec 调用 中 的 


pathname 而 非 第 一 个 参数 (testinterp) ， 因 为 一 般 而 言 ，pathname 包 含 
了 比 第 一 个 参数 更 多 的 信息 。 

实例 

在 解释 器 pathname 后 可 跟随 可 选 参数 。 如 果 一 个 解释 器 程序 支持 -f 
选项 ， 那 么 在 pathname 后 经 常 使 用 的 就 是 -f。 例如， 可 以 以 下 列 方式 执 
行 awk(1) 程 序 : 

awk -f myfile 

它 告 诉 awk 从 文件 myfile 中 读 awk 程 序 。 

在 UNIX System V 派 生 的 很 多 系统 中 ， 常 包含 有 awk 语 言 的 两 个 版 
本 。awk 和 名 第 被 称 为 “ 老 awk”， 它 是 与 V7 一 起 分 发 的 原始 版 本 。nawk 

(新 awk) 包含 了 很 多 增强 功能 ， 对 应 于 在 Aho 、Kernighan 和 

Weinberger[1988] 中 说 明 的 语言 。 此 新 版 本 提供 了 对 命令 行 参数 的 访 
问 ， 这 是 下 面 的 例子 所 需 的 。Solaris 10 提供 了 两 个 版 本 。 

POSIX 1003.2 标 准 现 在 是 Single UNIX Specification 中 基本 POSIX.1 
规 苑 的 一 部 分 。 在 该 标准 中 ，awk 程 序 是 其 中 的 一 个 实用 程序 。 该 实用 
程序 的 基础 也 是 Aho、Kernighan 和 Weinberger[1988] 中 所 描述 的 语言 。 

Mac OS X 10.6.8 中 的 awk 版 本 基于 贝尔 实验 室 版 本 ， 并 已 将 其 放 在 
公共 域 (public domain) 中 。FreeBSD 8.0 和 Linux 的 某 些 发 行 版 提供 
GNU awk (gawk) ， 它 链接 至 名 字 awk。gawk 版 本 遵循 POSIX 标 准 ， 
但 也 包括 了 一 些 扩展 。 因 为 gawk 和 贝尔 实验 室 的 awk 版 本 比较 新 ， 所 以 
较 之 nawk 或 老 版 本 的 awk 更 受 人 欢迎 。 (贝尔 实验 室 的 awk 版 本 可 从 
http://cm.bell-labs.com/cm/cs/awkbook/index.html 获 取 。) 

在 解释 器 文件 中 使 用 -f 选 项 ， 可 以 写成 : 

#!/bin/awk 一 

(在 此 解释 器 文件 中 后 跟随 awk 程 序 ) 

例如 ， 图 8-21 展 示 了 在 /usr/local/bin/awkexample 中 的 一 个 解释 器 文 

件 程序 。 


#!/usr/bin/awk -f 
# Note: on Solaris, use nawk instead 
BEGIN ( 
for (i = 0; i « ARGC; i++) 
printf "ARGV[$d] = %s\n", i, ARGV[i] 
exit 


图 8-21 作为 解释 器 文件 的 awk 程序 


如 果 路 径 前 缀 之 一 是 msrvlocaybin， 则 可 以 用 下 列 方式 执行 图 8-21 
中 的 程序 〈 假 定 我 们 已 打开 了 该 文件 的 执行 位 ) : 

$ awkexample filel FILENAME2 f3 

ARGV[O] = awk 

ARGV[1] = file1 

ARGV[2] = FILENAME2 

ARGV[3] = f3 

执行 /bin/awk 时 ， 其 命令 行 参数 是 : 

/bin/awk -f /usr/local/bin/awkexample filel FILENAME2 f3 

解释 器 文件 的 路 径 名 (/usr/localbinlawkexample) 被 传送 给 解释 
器 。 因 为 不 能 期 望 解 释 器 (在 本 例 中 是 /bin/awk) 会 使 用 PATH 变量 定 
位 该 解释 器 文件 ， 所 以 只 传送 其 路 径 名 中 的 文件 名 是 不 够 的 ， 要 将 解 
释 器 文件 完整 的 路 径 名 传送 给 解释 器 。 当 awk 读 解释 器 文件 时 ， 因 为 # 
是 awk 的 注释 字符 ， 所 以 它 忽 略 第 一 行 。 

可 以 用 下 列 命 令 验证 上 述 命令 行 参数 。 


$ /bin/su 成 为 超级 用 户 

Password: 输入 超级 用 户 
口令 

# mv /usr/bin/awk /usr/bin/awk.save 保存 原先 的 程序 

# cp /home/sar/bin/echoarg /usr/bin/awk 暂时 替换 它 

# suspend 用 作业 控制 挂 


起 超级 用 户 shell 


[1] * Stopped /bin/su 

$ awkexample filel FILENAME? f3 
argv[0]: /bin/awk 

argv[1]: -f 

argv[2]: /usr/local/bin/awkexample 
argv[3]: file1 

argv[4]: FILENAME2 


argv[5]: f3 

$ fg 用 作业 控制 恢复 
超级 用 户 shell 

/bin/su 

# mv /usr/bin/awk.save /usr/bin/awk 恢复 原先 的 程序 

# exit 终止 超级 用 户 


shell 

在 此 例子 中 ， 解 释 器 的 -{ 选 项 是 必需 的 。 正 如 前 述 ， 它 告诉 awk 在 
什么 地 方 找到 awk 程序 。 如 果 在 解释 器 文件 中 删除 -f 选 项 ， 则 在 试图 运 
行 该 解释 器 文件 时 ， 通 常 输出 一 条 出 错 消 息 。 该 出 错 消息 的 精确 文本 
可 能 有 所 不 同 ， 这 取决 于 解释 句 文 件 存放 在 何 处 以 及 其 余 参 数 是 否 表 
示 现 有 的 文件 等 。 因 为 在 这 种 情况 下 命令 行 参数 是 : 

/bin/awk /usr/local/bin/awkexample filel FILENAME2 f3 

于 是 awk 企图 将 字符 串 /usrvlocalbin/awkexample 解 释 为 一 个 awk 程 
序 。 如 果 不 能 向 解释 器 传递 至 少 一 个 可 选 参数 (在 本 例 中 是 -f) ， 那 么 
这 些 解 释 器 文件 只 有 对 shell 才 是 有 用 的 。 

是 否 一 定 需要 解释 右 文 件 呢 ? 那 也 不 完全 如 此 。 但 是 它们 确实 使 
用 户 得 到 效率 方面 的 好 处 ， 其 代价 是 内 核 的 额外 开销 (因为 识别 解释 
器 文件 的 是 内 核 ) 。 由 于 下 述 理由 ， 解 释 器 文件 是 有 用 的 。 


(1) 有 些 程序 是 用 某 种 语言 写 的 脚本 ， 解 释 器 文件 可 将 这 一 事实 
隐藏 起 来 。 例 如 ， 为 了 执行 图 8-21 程 序 ， 只 需 使 用 下 列 命令 行 : 
awkexample optional-arguments 
而 并 不 需要 知道 该 程序 实际 上 是 一 个 awk 脚 本 ， 否 则 就 要 以 下 列 方 
式 执行 该 程序 : 
awk -f awkexample optional-arguments 

(2) 解释 器 脚本 在 效率 方面 也 提供 了 好 处 。 再 考虑 一 下 前 面 的 例 
子 。 仍 旧 隐 藏 该 程序 是 一 个 awk 脚本 的 事实 ， 但 是 将 其 放 在 一 个 shell 脚 
本 中 : 

awk 'BEGIN { 
for (i = 0; i < ARGC; i++) 
printf "ARGV[%d] = %s\n", i, ARGV[i] 
exit 
py $* 
JUPE REL IR TT TERI [n] ped cee BS OK BE AY LE * IC, shell BEC ag 
令 ， 然 后 试图 execlp 此 文件 名 。 因 为 shell 脚 本 是 一 个 可 执行 文件 ， 但 却 
不 是 机 器 可 执行 的 ， 于 是 返回 一 个 错误 ，execlp 就 认为 该 文件 是 一 个 
shell 脚本 〈 它 实际 上 就 是 这 种 文件 ) 。 然 后 执行 /bin/sh， 并 以 该 shell 
脚本 的 路 径 名 作为 其 参数 。shell 正 确 地 执行 我 们 的 shell 脚 本 ， 但 是 为 了 
运行 awk 程序 ， 它 调用 fork、exec 和 wait。 于 是 ， 用 一 个 shell 脚 本 代替 解 
释 句 脚本 需要 更 多 的 开销 。 

(3) 解释 器 脚本 使 我 们 可 以 使 用 除 /bim/sh 以 外 的 其 他 shell 来 编写 
shell 脚 本 。 当 execlp 找 到 一 个 非 机 器 可 执行 的 可 执行 文件 时 ， 它 总 是 调 
用 /bin/sh 来 解释 执行 该 文件 。 但 是 ， 用 解释 器 脚本 则 可 简单 地 写成 : 

#!/bin/csh 
(在 解释 器 文件 中 后 跟随 C shell 脚 本 ) 


再 一 次 ， 我 们 也 可 将 此 放 在 一 个 /bin/sh 脚 本 中 (然后 由 其 调用 C 
shell) ， 但 是 要 有 更 多 的 开销 。 如 果 3 个 shel 和 awk 没有 用 # 作 为 注释 
符 ， 则 上 面 所 说 的 都 无 效 。 


8.13 图 数 system 


在 程序 中 执行 一 个 命令 字符 串 很 方便 。 例 如 ， 假 定 要 将 时 间 和 日 
期 放 到 某 一 个 文件 中 ， 则 可 使 用 6.10 节 中 的 函数 实现 这 一 点 。 调 用 time 
得 到 当前 日 历时 间 ， 接 着 调用 localtime 将 日 历时 间 变 换 为 年 、 月、 日 、 
时 、 分 、 秒 、 周 日 的 分 解 形 式 ， 然 后 调用 strftime 对 上 面 的 结果 进行 格 
式 化 处 理 ， 最 后 将 结果 写 到 文件 中 。 但 是 用 下 面 的 system 函 数 则 更 容易 
做 到 这 一 点 : 

system("date > file"); 

ISO Cx X. f system EN žit, (AEH BRAT A STAY HR OR PE ARR e 
POSIX.1 44 T sysemłž O, EY Ke [ISO CAE X., fii ult [ system Æ 
POSIX.1 环 境 中 的 运行 行为 。 

#include <stdlib.h> 


int system(const char *cmdstring); 


返回 值 : COP) 

如 果 cmdstring 是 一 个 空 指针 ， 则 仅 当 命令 处 理 程序 可 用 时 ，system 
返回 非 0 值 ， 这 一 特征 可 以 确定 在 一 个 给 定 的 操作 系统 上 是 否 文 持 
system EX 2X ° ÆUNIXF, systems. æn] HAS ° 

因为 system 在 其 实现 中 调用 了 fork、exec 和 waitpid， 因 此 有 3 种 返回 
值 。 

(1) fork 失 败 或 者 waitpid 返 回 除 EINTR 之 外 的 出 错 ， 则 system 返 

回 -1， 并 且 设 置 errmmo 以 指示 错误 类 型 。 


(2) 如 果 exec 失 败 (表示 不 能 执行 shell) ， 则 其 返回 值 如 同 shell 
执行 了 exit(127) 一 样 。 

(3) 否则 所 有 3 个 函数 (fork、exec 和 waitpid) 都 成 功 ， 那 么 
system 的 返回 值 是 shell 的 终止 状态 ， 其 格式 已 在 waitpid 中 说 明 。 

如 果 waitpid 被 一 个 捕捉 到 的 信号 中 断 ， 则 某 些 早期 的 system 实现 
都 返回 错误 类 型 值 EINTR。 但 是 ， 因 为 没有 可 用 的 策略 能 让 应 用 程序 
从 这 种 错误 类 型 中 恢复 〈 子 进程 的 进程 ID 对 调用 者 来 说 是 未 知 的 ) 。 
POSIX 后 来 增加 了 下 列 要 求 : 在 这 种 情况 下 system 丰 返回 一 个 错误 。 

(10.5 节 中 将 讨论 被 中 断 的 系统 调用 。) 

图 8-22 中 的 程序 是 system 函 EUN — 种 实现 。 它 对 信号 没有 进行 处 

理 。10.18 贡 中 将 修改 此 函数 使 其 进行 信号 处 理 。 


#include <sys/wait.h> 
#include <errno.h> 
#include <unistd.h> 


int 
system(const char *cmdstring) /* version without signal handling */ 
{ 

pid t pid; 


int status; 
if (cmdstring == NULL) 
return(1); /* always a command processor with UNIX */ 


if ((pid = fork()) « 0) { 


status = -1; /* probably out of processes */ 
} else if (pid == 0) { /* child */ 
execl ("/bin/sh", "sh", "-c", cmdstring, (char *)0); 
_exit (127); /* execl error */ 
} else { /* parent */ 
while (waitpid(pid, &status, 0) < 0) { 
if (errno != EINTR) { 
status = -1; /* error other than EINTR from waitpid() */ 
break; 


} 


return (status) ; 


图 8-22 systemEN ae (没有 对 信号 进行 处 理 ) 


shell 的 -c 选 项 告诉 shell 程 序 取 下 一 个 命令 行 参数 (在 这 里 是 
cmdstring) 作为 命令 输入 (而 不 是 从 标准 输入 或 从 一 个 给 定 的 文件 中 
读 命令 ) 。shell 对 以 null 字 闻 终止 的 命令 字符 串 进行 语法 分 析 ， 将 它们 
分 成 命令 行 参 数 。 传 递 给 shell 的 实际 命令 字符 串 可 以 包含 任 一 有 效 的 
shell 命 令 。 例 如 ， 可 以 用 < 和 > 对 输入 和 输出 重 定 回 。 

如 果 不 使 用 shell 执 行 此 命令 ， 而 是 试图 由 我 们 自己 去 执行 它 ， 那 
将 相当 困难 。 首 先 ， 我 们 必须 用 execlp 而 不 是 execl， 像 shell 那 样 使 用 
PATH 变 量 。 我 们 必须 将 null 字 六 终止 的 命令 字符 串 分 成 各 个 命令 行 参 
数 ， 以 便 调用 execlp。 最 后 ， 我 们 也 不 能 使 用 任何 一 个 shell 元 字符 。 

注意 ， 我 们 调用 _exit 而 不 是 exit。 这 是 为 了 防止 任 一 标准 VO 绥 冲 

(这 些 缓冲 会 在 fork 中 由 父 进程 复制 到 子 进 程 ) 在 子 进程 中 被 冲洗 。 

用 图 8-23 中 的 程序 对 这 种 实现 的 system 函 数 进 行 测试 (pr_exit EN Zi 

定义 在 图 8-5 程 序 中 ) 。 


#include "apue.h" 
#include <sys/wait.h> 


int 
main (void) 
( 


inc status; 


if ((status = system("date")) < 0) 
err sys("system() error"); 


pr exit(status); 


if ((status = system("nosuchcommand")) « 0) 
err sys("system() error"); 


pr exit(status); 


if ((status = system("who; exit 44")) « 0) 
err sys("system() error"); 


pr exit(status); 


exit(0); 


图 8-23 i/i] Fl system ER Zt 


运行 图 8-23 程 序 得 到 : 

$ /a.out 

Sat Feb 25 19:36:59 EST 2012 

normal termination, exit status = 0 对 于 date 

sh: nosuchcommand: command not found 

normal termination, exit status = 127 对 于 无 此 种 命令 


Sar console Jan 1 14:59 

Sar ttys000 Feb 7 19:08 

Sar ttys001 Jan 15 15:28 

Sar ttys002 Jan 15 21:50 

Sar ttys003 Jan 21 16:02 

normal termination, exit status = 44 对 于 exit 


使 用 system 而 不 是 直接 使 用 fork 和 exec 的 优点 是 : system 进行 了 所 
需 的 各 种 出 错 处 理 以 及 各 种 信号 处 理 (在 10.18 市 中 的 下 一 个 版 本 
systemEN UF) 。 

在 UNIX 的 早期 系统 中 ， 包 括 SVR3.2 和 4.3BSD， 都 没有 waitpid 画 
数 ， 于 是 父 进 程 用 下 列 形式 的 语句 等 待 子 进程 : 

while ((lastpid = wait(&status)) != pid && lastpid != -1) 


如 果 调 用 system 的 进程 在 调用 它 之 前 已 经 生成 子 进 程 ， 那 么 将 引 
起 问题 。 因 为 上 面 的 while 语 名 一直 循 环 执行 ， 直 到 由 system 产 生 的 子 
d 如 果 不 是 用 pid 标 识 的 任 一 子 进程 在 pid 子 进程 之 前 终 

， 则 它们 的 进程 DD 和 终止 状态 都 被 while 语 句 丢 弃 。 实 际 上 ， 由 于 
wait 不 能 等 每 一 个 指定 的 进程 以 及 其 他 一 些 原 因 ，POSIX.1 Rationale 
Z «E X. T waitpid WX » AIR ASE waitpid EN ZX, popen#lpclose kh 25 t5 
会 发 生 同 样 的 问题 (0015.38). ° 

设置 用 户 ID 程序 


如 果 在 一 个 设置 用 户 ID 程序 中 调用 system, ABR RET AWE? 这 
是 一 个 安全 性 方面 的 漏洞 ， 决 不 应 当 这 样 做 。 岁 8-24 程 序 是 一 个 简单 程 
序 ， 它 只 是 对 其 命令 行 参数 调用 System 函数 。 


#include "apue.h" 

int 

main(int argc, char *argv[]) 
( 


int status; 


if (argc « 2) 


err quit("command-line argument required"); 


if ((status = system(argv[1])) < 0) 
err sys("system() error"); 


pr exit(status); 


exit(0); 


图 8-24 用 system 执 行 命令 行 参数 
将 此 程序 编译 成 可 执行 目标 文件 tsys。 


图 8-25 所 示 的 是 另 一 个 简单 程序 ， 它 打印 实际 用 户 ID 和 有 效用 户 
ID ° 


#include "apue.h" 


int 
main(void) 
{ 


printf("real uid = %d, effective uid = %d\n" 


, getuid(), geteuid()); 
exit(0); 


图 8-25 打印 实际 用 户 ID 和 有 效用 户 ID 
将 此 程序 编译 成 可 执行 目标 文件 printuids。 运 行 这 两 个 程序 ， 得 到 
如 下 结 


$ tsys printuids 正常 执行 ， 无 特权 real uid 
= 205, effective uid = 205 


normal termination, exit status = 0 


$ su 成 为 超级 用 户 
Password: 输入 超级 用 户口 令 
# chown root tsys 更 改 所 有 者 

# chmod u+s tsys 增加 设置 用 户 ID 

# Is -l tsys 检验 文件 权限 和 所 有 者 
-rwsrwxr-x 1 root 7888 Feb 25 22:13 tsys 

# exit 退出 超级 用 户 shell 


$ tsys printuids 

real uid = 205, effective uid = 0 哎呀 ! 这 是 一 个 安全 性 漏洞 

normal termination, exit status = 0 

我 们 给 予 tsys 程 序 的 超级 用 户 权 限 在 system 中 执行 了 fork 和 exec 之 后 
仍 被 保持 下 来 。 

有 些 实现 通过 更 改 /bin/sh， 当 有 效用 户 ID 与 实际 用 户 ID 不 匹配 时 ， 
将 有 效用 户 ID 设置 为 实际 用 户 ID ， 这 样 可 以 关闭 上 述 安 全 漏洞 。 在 这 
些 系统 中 ， 上 述 示 例 的 结果 束 不 会 发 生 。 不 管 调用 system 的 程序 设置 用 
户 ID 位 状态 如 何 ， 都 会 打印 出 相同 的 有 效用 户 ID 。 

如 果 一 个 进程 正 以 特殊 的 权限 《设置 用 户 ID 或 设置 组 ID) 运行 ， 
它 又 想 生 成 另 一 个 进程 执行 另 一 个 程序 ， 则 它 应 当 直 接 使 用 fork 和 
exec， 而 且 在 fork 之 后 、exec 之 前 要 更 改 回 普通 权限 。 设 置 用 户 ID 或 设 
置 组 ID 程序 决 不 应 调用 system 函 数 。 

这 种 警告 的 一 个 理由 是 : system 调 用 shell 对 命令 字符 串 进行 语法 分 
析 ， 而 shell 使 用 IFS 变 量 作为 其 输入 字段 分 隔 符 。 早 期 的 shell 和 版 本 在 被 
调用 时 不 将 此 变量 重 置 为 普通 字符 集 。 这 就 允许 一 个 恶意 的 用 户 在 调 
用 system 之 前 设置 IFS， 造 成 system 执 行 一 个 不 同 的 程序 。 


8.14 进程 会 计 


大 多 数 UNIX 系 统 提 供 了 一 个 选项 以 进行 进程 会 计 (process 
accounting) 处 理 。 启 用 该 选项 后 ， 每 当 进 程 结束 时 内 核 束 写 一 个 会 计 
记录 。 典 型 的 会 计 记 录 包 含 总 量 较 小 的 二 进 制 数 据 ， 一 般 包括 命令 
和 名、 所 使 用 的 CPU 时 间 总 量 、 用 户 ID 和 组 ID、 启 动 时 间 等 。 本 节 将 较 
详细 地 说 明 这 种 会 计 记录 ， 这 样 也 使 我 们 得 到 了 一 个 再 次 观察 进程 的 
机 会 ， 以 及 使 用 5.9 方 中 所 介绍 的 fread 函 数 的 机 会 。 

任 一 标准 都 没有 对 进程 会 计 进 行 过 说 明 。 于 是 ， 所 有 实现 都 有 令 
人 厌烦 的 差别 。 例 如 ， 关 于 IO 的 数量 ，Solaris 10 使 用 的 单位 是 字 市 ， 
FreeBSD 8.0 和 Mac OS X 10.6.8 使 用 的 单位 是 块 ， 但 又 不 考虑 不 同 的 块 
长 ， 这 使 得 该 计数 值 并 无 实际 效用 。Linux 3.2.0 则 完全 没有 保持 IO 统 
计数 。 

每 种 实现 也 都 有 目 己 的 一 套 管理 命令 去 处 理 这 种 原始 的 会 计数 
据 。 例 如 ，Solaris 提供 了 runacct(1m) 和 acctcom(1)，FreeBSD 则 提供 
sa(8) 命 令 处 理 并 总 结 原始 会 计数 据 。 

一 个 至 今 没有 说 明 的 范 数 (acct) 启用 和 禁用 进程 会 计 。 唯 一 使 用 
这 一 函数 的 是 accton(8) 命 令 〈 这 是 在 几 种 平台 上 都 类 似 的 少数 几 条 命令 
中 的 一 条 ) 。 超 级 用 户 执行 一 个 带路 径 名 参数 的 accton 命 令 启 用 会 计 处 
理 。 会 计 记 录 写 到 指定 的 文件 中 ， 在 FreeBSD 和 Mac OS X 中 ， 该 文件 
通常 是 /var/account/acct; 在 Linux 中 ， 该 文件 是 /var/account/pacct; 在 
Solaris 中 ， 该 文件 是 /var/adm/pacct。 执行 不 带 任何 参数 的 accton 命 令 则 
停止 会 计 处 理 。 

会 计 记 录 结 构 定 义 在 头 文件 <sys/accth> 中 ， 虽 然 每 种 系统 的 实现 
各 不 相同 ， 但 会 计 记录 样式 基本 如 下 : 


typedef | u short comp t; /* 3-bit base 8 exponent; 13-bit 
fraction*/ 


struct acct 


{ 

char ac flag; /* flag (see Figure 8.26)*/ 

char ac stat; /* termination status(signal & core 
flag only)*/ 

/* (Solaris only)*/ 

uid t ac uid; /* real user ID*/ 

gid t ac gid; /* real group ID*/ 

dev t ac tty; /* controlling terminal */ 

time t ac btime; /* starting calendar time*/ 

comp tac utime; /* user CPU time*/ 

comp tac stime; /* system CPU time*/ 

comp tac etime; /* elapsed time*/ 

comp tac mem; /* average memory usage*/ 

comp t ac io; /* bytes transferred (by read and 
write)*/ 

comp tac rw; /* blocks read or written*/ 

char ac comm[8]; /* command name: [8] for 
Solaris, */ 


/* "blocks" on BSD systems*/ 

/* (not present on BSD systems)*/ 

/* [10] for Mac OS X, [16] for FreeBSD, and*/ 
/* [17] for Linux*/ 


在 大 多 数 的 平台 上 ， 时 间 是 以 时 钟 滴答 数 记 录 的 ， 但 FreeBSD 以 微 
秒 进 行 记 录 的 。ac_flag 成 员 记 录 了 进程 执行 期 间 的 某 些 事件 。 这 些 事 
件 见 图 8-26。 
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进程 是 由 fork 产生 的 ， 但 从 未 调用 exec 
进程 使 用 超级 用 户 特 权 


进程 转 储 core 

进程 由 一 个 信号 杀 死 
扩展 的 会 计 条 目 

新 记录 格式 


图 8-26 会 计 记 录 中 的 ac_flag 值 

会 计 记录 所 需 的 各 个 数据 (各 CPU 时 间 、 传 输 的 字符 数 等 ) 都 由 
内 核 保存 在 进程 表 中 ， 并 在 一 个 新 进程 被 创建 时 初始 化 (如 fork 之 后 在 
子 进程 中 ) 。 进 程 终止 时 写 一 个 会 计 记录 。 这 产生 两 个 后 果 。 

第 一 ， 我 们 不 能 获取 永远 不 终止 的 进程 的 会 计 记录 。 像 init 这 样 的 
进程 在 系统 生命 周期 中 一 直 在 运行 ， 并 不 产生 会 计 记录 。 这 也 同样 适 
合 于 内 核 守 护 进 程 ， 它 们 通常 不 会 终止 。 

第 二 ， 在 会 计 文件 中 记录 的 顺序 对 应 于 进程 终止 的 顺序 ， 而 不 是 
它们 启动 的 顺序 。 为 了 确定 局 动 顺序 ， 需 要 读 全 部 会 计 文件 ， 并 按 局 
动 日 历时 间 进 行 排序 。 这 不 是 一 种 很 完善 的 方法 ， 因 为 日 历时 间 的 单 
位 是 秒 ( 见 1.10 节 ) ， 在 一 个 给 定 的 秒 中 可 能 启动 了 多 个 进程 。 而 墙 
上 时 钟 时 间 的 单位 是 时 钟 滴答 〈 通 常 ， 每 秒 滴答 数 在 60~128) 。 但 是 
我 们 并 不 知道 进程 的 终止 时 间 ， 所 知道 的 只 是 局 动 时 间 和 终止 顺序 。 
这 就 意味 着 ， 即 使 墙 上 时 钟 时 间 比 启动 时 间 要 精确 得 多 ， 仍 不 能 按照 
会 计 文 件 中 的 数据 重 构 各 进程 的 精确 启动 顺序 。 

会 计 记录 对 应 于 进程 而 不 是 程序 。 在 fork 之 后 ， 内 核 为 子 进程 初始 
化 一 个 记录 ， 而 不 是 在 一 个 新 程序 被 执行 时 初始 化 。 虽 然 exec 并 不 创建 
一 个 新 的 会 计 记录 ， 但 相应 记录 中 的 命令 名 改变 了 ，AFORK 标 志 则 被 


清除 。 这 意味 着 ， 如 果 一 个 进程 顺序 执行 了 3 个 程序 (A execB、B 
exec C， 最 后 是 C exit) ， 只 会 写 一 个 会 计 记 录 。 在 该 记录 中 的 命令 名 
对 应 于 程序 C， 但 CPU 时 间 是 程序 A、B 和 C 之 和 。 

实例 

为 了 得 到 某 些 会 计数 据 以 便 查 看 ， 我 们 按 图 8-27 编 写 了 测试 程序 。 

测试 程序 的 源 代码 如 图 8-28 所 示 。 该 程序 调用 4 次 fork。 每 个 子 进 
程 做 不 同 的 事情 ， 然 后 终止 。 


sleep(2) Tor 第 一 个 子 进程 
exit(2) Lo 
sleep(4) ty 第 二 个 子 进程 
abort() & 
Or. 第 三 个 子 进程 
£ 
sleep(8) Or 第 四 个 子 进程 
exit(0) 


sleep(6) 


execl kill() 


/bin/dd 


图 8-27 会 计 处 理 实例 的 进程 结构 


#include "apue.h" 


int 
main (void) 
( 
pid t pid; 


if ((pid = fork()) « 0) 
err sys ("fork error"); 


else if (pid != 0) { /* parent */ 
sleep (2); 
exit (2); /* terminate with exit status 2 */ 


if ((pid = fork()) < 0) 
err sys("fork error"); 


else if (pid != 0) { /* first child */ 
sleep(4); 
abort(); /* terminate with core dump */ 


if ((pid = fork()) « 0) 
err sys("fork error"); 


else if (pid != 0) { /* second child */ 
execl("/bin/dd", "dd", "if-/etc/passwd", "of-/dev/null", NULL); 
exit(7); /* shouldn't get here */ 


if ((pid = fork()) < 0) 
err_sys("fork error"); 


else if (pid != 0) { /* third child */ 
sleep (8); 
exit (0); /* normal exit */ 
} 
sleep (6); /* fourth child */ 
kill(getpid(), SIGKILL); /* terminate w/signal, no core dump */ 
exit (6); /* shouldn't get here */ 


图 8-28 产生 会 计数 据 的 程序 


在 Solaris 上 运行 该 测试 程序 ， 然 后 用 图 8-29 中 的 程序 从 会 计 记录 中 
jefe — ES BFF TT EN MK 


#include "apue.h" 
#include <sys/acct.h> 


#if defined(BSD) /* different structure in FreeBSD */ 
#define acct acctv2 

*define ac flag ac trailer.ac flag 

#define FMT "$-*.*s e = %.0f, chars = $.0f, $c $c $c $cWMn" 
#elif defined(HAS AC STAT) 

#define FMT "$-*.*s e = $61d, chars = $71d, stat = $3u: $c $c $c $cWMn" 
#else 

#define FMT "%-*.*s e = %6ld, chars = $71d, $c $c $c $c\n" 
#endif 

#if defined (LINUX) 

*define acct acct v3 /* different structure in Linux */ 
#tendif 


#if !defined(HAS ACORE) 
#define ACORE 0 

#endif 

*if !defined(HAS AXSIG) 
#define AXSIG 0 

#endif 


#if !defined (BSD) 
static unsigned long 
compt2ulong(comp_t comptime) /* convert comp t to unsigned long */ 
{ 
unsigned long val; 
int exp; 


val = comptime & Oxlfff; /* 13-bit fraction */ 


exp = (comptime >> 13) & 7; /* 3-bit exponent (0-7) */ 
while (exp-- > 0) 
val *= 8; 


return (val); 


} 
#endif 


int 
main(int argc, char *argv[]) 
{ 
struct acct acdata; 
FILE *fp; 


if (argc != 2) 
err quit("usage: pracct filename"); 


if ((fp = fopen(argv[1], "r")) == NULL) 
err sys("can't open $s", argv[1]); 
while (fread(&acdata, sizeof(acdata), 1, fp) == 1) { 


printf(FMT, (int)sizeof(acdata.ac comm), 
(int)sizeof(acdata.ac comm), acdata.ac comm, 
#if defined (BSD) 
acdata.ac etime, acdata.ac io, 


#else 
compt2ulong(acdata.ac_etime), compt2ulong(acdata.ac_io), 
#endif 
#if defined(HAS AC STAT) 
(unsigned char) acdata.ac_stat, 
#endif 


acdata.ac flag & ACORE ? 'D' : ' ', 
acdata.ac flag & AXSIG ? 'X' : ' ', 
acdata.ac flag & AFORK ? 'F' : T ', 
acdata.ac flag & ASU gg. a woo 


} 

if (ferror (Tp) ) 
err_sys("read error"); 

exit (0); 


图 8-29 打印 从 系统 会 计 文件 中 选 出 的 字段 


BSD 派生 的 平台 不 支持 ac stat 成 员 ， 所 以 我 们 在 支持 该 成 员 的 平 
台 上 定义 了 HAS_AC_STAT 常量 。 基 于 特性 而 非 平 台 定 义 的 符号 常量 
使 代码 更 易 读 ， 也 使 我 们 更 容易 修改 程序 。 修 改 的 方法 是 对 编译 命令 
增加 新 的 定义 。 震 代 方 法 可 以 是 使 用 : 

tif Idefined(BSD) && !defined(MACOS) 

但 是 ， 当 将 应 用 移植 到 其 他 平台 上 时 ， 这 种 方法 会 带 来 很 大 的 不 
便 。 

我 们 定义 了 类 似 的 常量 以 判断 该 平台 是 否 支 持 ACORE 和 AXSIG 会 
计 标志 。 我 们 不 外 a 其 原因 是 ， 在 Linux 中 ， 
它们 被 定义 为 enqum 类 型 值 ， 而 在 ##fdef 表 达 式 中 不 能 使 用 此 种 类 型 值 。 

为 了 进行 测试 ， 执 行 下 列 操作 步骤 

(1) 成 为 超级 用 户 ， 用 accton 命 令 启用 会 计 处 理 。 注 意 ， 当 此 命 


令 结 束 时 ， 会 计 处 理 已 经 启用 ， 因 此 在 会 计 文件 中 的 第 一 个 记录 应 来 
自 这 一 命令 。 

(2) 终止 超级 用 户 shell， 运 行 图 8-28 程 序 。 这 会 追加 6 个 记录 到 
会 计 文件 中 (超级 用 户 shell 一 个 、 父 进程 一 个 、4 个 子 进程 各 一 个 ) 。 


在 第 二 个 子 进 程 中 ，execl 并 不 创建 一 个 新 进程 ， 所 以 对 第 二 个 进 
程 只 有 一 个 会 计 记录 。 (3) 成 为 超级 用 户 ， 停 止 会 计 处 理 。 因 为 在 


accton 命 令 终止 时 已 经 停止 会 计 处 理 ， 所 以 不 会 在 会 计 文 件 中 增加 一 个 
记录 。 
(4) 运行 图 8-29 程 序 ， 从 会 计 文件 中 选 出 字段 并 打印 。 
第 4 步 的 输出 如 下 面 所 示 。 在 每 一 行 中 都 对 进程 追加 了 说 明 ， 以 便 


后 面 讨论 。 

accton e= 1,chars = 336, stat= 0: S 

sh e= 1550,chars = 20168,stat = 0: S 

dd e= 2, chars= 1585,stat = 0: 第 
人 

a.out e= 202, chars = 0, stat = 0: AC t 
KE 

a.out e= 420, chars = 0, stat = 134: F E: 
—^N-T xtRE 

a.out e- 600, chars = 0, stat = 9: F 第 四 
TF fü 

a.out e= 801, chars = 0, stt = 0: F "B — 
个 子 进程 


甫 上 时 钟 时 间 值 的 单位 是 每 秒 滴答 数 。 从 图 2-15 中 可 见 ， 本 系统 的 
每 秒 滴 答 数 是 100。 例 如 ， 在 父 进程 中 的 sleep(2) 对 应 于 墙 上 时 钟 时 间 
202 个 时 钟 滴答 。 对 于 第 一 个 子 进 程 ，sleep(4) 变 成 420 时 钟 滴答 。 注 
意 ， 一 个 进程 休眠 的 时 间 总 量 并 不 精确 。 〈 第 10 章 将 返回 到 sleep 画 
数 。) 调用 forkk 和 exit 也 需要 一 些 时 间 。 

注意 ，ac_stat 成 员 并 不 是 进程 的 真正 终止 状态 。 它 只 是 8.6 节 中 讨 
论 的 终止 状态 的 一 部 分 。 如 果 进 程 异 常 终止 ， 则 此 字 节 包含 的 信息 只 
是 core 标 志 位 (一般 是 最 高 位 ) 以 及 信号 编号 数 (一 般 是 低 7 位 ) 。 如 
果 进 程 正常 终止 ， 则 从 会 计 文 件 不 能 得 到 进程 的 退出 (exi) 状态 。 对 
于 第 一 个 子 进程 ， 此 值 是 128+6。128 是 core 标 志 位 ，6 是 此 系统 信号 


SIGABRTHJf& 〈 它 是 由 调用 abort 产 生 的 ) 。 第 四 个 子 进程 的 值 是 9， 它 
对 应 于 SIGKILL 的 值 。 从 会 计 文 件 的 数据 中 不 能 分 辨 出 ， 父 进程 在 退 
出 时 所 用 的 参数 值 是 2， 第 三 个 子 进程 退出 时 所 用 的 参数 值 是 0。 

dd 进程 将 文件 /etc/passwd 复 制 到 第 二 个 子 进程 中 ， 该 文件 的 长 度 是 
777F 1 ° MVOF ASCE EN, HRA T7774, AALE 
了 777 字 广 。 即 使 输出 到 空 设备 ， 但 仍 对 1/O 字符 数 进行 计算 。dd 命令 
还 有 31 个 附加 字 市 ， 用 于 报告 恋 写 字 市 数 的 摘要 信息 ， 该 摘要 信息 也 
会 在 stdout 上 打印 输出 。 

ac_flag 值 与 我 们 所 预料 的 相同 。 除 调用 exedl 的 第 二 个 子 进程 以 
外 ， 其 他 子 进 程 都 设置 了 F 标志 。 父 进程 没有 设置 F 标志 ， 其 原因 是 执 
行 父 进 程 的 交互 式 shell 调 用 fork， 然 后 执行 a.out 文 件 。 第 一 个 子 进 程 
调用 abort，abort 产 生 信 号 SIGABRT， 产 生 了 core 转 储 。 该 进程 的 X 标 志 
和 D 标 志 都 没有 打开 ， 因 为 Solaris 不 文 持 它们 ;相关 信息 可 从 ac_stat 字 
段 导 出 。 第 四 个 子 进程 也 因 信和 号 而 终止 ， 但 是 SIGKILL 信 和 号 并 不 产生 
core 转 储 ， 它 只 是 终止 该 进程 。 

最 后 要 说 明 的 是 : 第 一 个 子 进程 的 VO 字符 数 为 0， 但 是 该 进程 产 
生 了 一 个 core 文件 。 其 原因 是 写 core 文 件 所 需 的 IO 并 不 由 该 进程 负 


SE 
Di? 


8.15 未 识 


任 一 进程 都 可 以 得 到 其 实际 用 户 ID 和 有 效用 户 ID 及 组 ID。 但 是 ， 
我 们 有 时 和 希望 找到 运行 该 程序 用 户 的 登录 名 。 我 们 可 以 调用 
getpwuid(getuid())， 但 是 如 果 一 个 用 户 有 多 个 登录 名 ， 这 些 登 录 名 义 对 
应 着 同一 个 用 户 ID， 又 将 如 何 呢 ? (一 个 人 在 口令 文件 中 可 以 有 多 个 
登录 项 ， 它 们 的 用 户 D 相同 ， 但 登录 shell 不 同 。) 系统 通常 记录 用 


户 登 录 时 使 用 的 名 字 (IL 68 5) ， 用 getlogin 芳 数 可 以 获取 此 登录 
名 o 

#include <unistd.h> 

char *getlogin(void); 
返回 值 : AaB, IRSA TIRE: At, JAK[SINULL 

ANAS 8] H AEG SB HER 1C XE 81] FE ES PA EA in, EK 
数 会 失败 。 通 常 称 这 些 进程 为 守护 进程 (daemon) , 58 13 章 将 对 这 种 
进程 专门 进行 讨论 。 

给 出 了 登录 名 ， 就 可 用 getpwnam 在 口令 文件 中 查找 用 户 的 相应 记 
孙 ， 从 而 确定 其 登录 shell 等 。 

为 了 找到 登录 名 ，UNIX 系 统 在 历史 上 一 直 是 调用 ttyname 函 数 ( 见 
18.9 节 ) ， 然 后 在 utmp 文 件 (06.87) 中 找 匹 配 项 。FreeBSD 和 Mac 
OS X 将 登录 名 存放 在 与 进程 表 项 相关 联 的 会 话 结构 中 ， 并 提供 系统 调 
用 获取 该 登录 名 。 

System V $e BE cuserid EX ZOX [B] XE 3€ 44. ^. HC ER BFE Us] HA getlogin EX 
数 ， 如 果 失 败 则 再 调用 getpwuid(getuid())。IEEE 标 准 1003.1-1988 说 明了 
cuserid， 但 是 它 以 有 效用 户 攻 而 不 是 实际 用 户 人 D 来 调用 。POSIX.1 的 
1990 版 本 删除 了 cuserid 函 数 。 

环境 变量 LOGNAME 通 常 由 login(1) 以 用 户 的 登录 名 对 其 赋 初 值 ， 
并 由 登录 shell 继 承 。 但 是 ， 用 户 可 以 修改 环境 变量 ， 所 以 不 能 使 用 
LOGNAME 来 验证 用 户 ， 而 应 当 使 用 getlogin 函 数 。 


UNIX 系统 历史 上 对 进程 提供 的 只 是 基于 调度 优 移 级 的 粗 粒 度 的 控 
制 。 调 度 策 略 和 调度 优先 级 是 由 内 核 确定 的 。 进 程 可 以 通过 调整 nice 值 


选择 以 更 低 优 先 级 运行 (通过 调整 nice 值 降低 它 对 CPU 的 占有 ， 因 此 该 
进程 是 “友好 的 ”>) 。 只 有 特权 进程 允许 提高 调度 权限 。 

POSIX 实 时 扩展 增加 了 在 多 个 调度 类 别 中 选择 的 接口 以 进一步 细 
调 行 为 。 我 们 这 里 只 讨论 用 于 调整 nice 值 的 接口 ， 这 些 包 括 在 POSIX.1 
的 XSI 扩 展 选 项 中 。 关 于 实时 调度 扩展 更 多 的 信息 ， 可 参考 
Gallmeister[ 1995] ° 

Single UNIX Specification "F nice (E AYU E Æ O~(2*NZERO)-1 之 
间 ， 有 些 实现 支持 0~2*NZERO 。nice 值 越 小 ， 优 先 级 越 高 。 虽 然 这 看 
起 来 有 点 倒退 ， 但 实际 上 是 有 道理 的 : 你 越 友 好 ， 你 的 调度 优先 级 台 
越 低 。NZERO 是 系统 默认 的 nice 值 。 

注意 ， 定 义 NZERO 的 头 文件 因 系统 而 异 。 除 了 头 文件 以 外 ， 
Linux 3.2.0 可 以 通过 非 标准 的 sysconf 参 数 (_SC_NZERO) 来 访问 
NZERO 的 值 。 

进程 可 以 通过 nice 函 数 获 取 或 更 改 它 的 nice 值 。 使 用 这 个 函数 ， 进 
程 只 能 影响 目 己 的 nice 值 ， 不 能 影响 任何 其 他 进程 的 nice 值 。 


#include <unistd.h> 


int nice(int incr); 
返回 值 ， 若 成 功 ， 返 回 新 的 nice 值 NZERO; 若 出 错 ， 返 回 -1 

incr 参 数 被 增加 a 到 调用 进程 的 nice 值 上 。 如 采 incr 太 大 ， 系 统 直接 把 
它 降 到 最 大 合法 值 ， 不 给 出 提示 。 类 似 地 ， 如 果 incr 太 小 ， 系 统 也 会 无 
声息 地 把 它 提 高 到 最 小 合法 值 。 由 于 -1 是 合法 的 成 功 返 回 值 ， 在 调用 
nice 国 数 之 前 需要 清楚 errmno， 在 nice 函 数 返 回 -1 时 ， 需 要 检查 它 的 值 。 
如 果 nice 调 用 成 功 ， 并 且 返 回 值 为 -1， 那 么 errno 仍 然 为 0。 如果 errno 不 
为 0， 说 明 nice 调 用 失败 。 

getpriority 函 数 可 以 像 nice 函 数 那 样 用 于 获取 进程 的 nice 值 ， 但 是 
getpriority 还 可 以 获取 一 组 相关 进程 的 nice 值 。 


#include <sys/resource.h> 


int getpriority(int which, id t who); 

返回 值 ， 若 成 功 ， 返 回 -NZERO~NZERO-1 之 间 的 nice 值 ， 若 出 错 ， 返 
回 -1 

which 参 数 可 以 取 以 下 三 个 值 之 一 : PRIO_PROCESS 表示 进程 ， 
PRIO_PGRP 表示 进程 组 ， PRIO_USER 表 示 用 户 ID。which 参 数控 制 
who 参 数 是 如 何 解释 的 ，who 参 数 选择 感 兴趣 的 一 个 或 多 个 进程 。 如 果 
who 参 数 为 0， 表 示 调 用 进程 、 进 程 组 或 者 用 户 (取决 于 which 参 数 的 
值 ) 。 当 which 设 为 PRIO_USER 并 且 who 为 0 时 ， 使 用 调用 进程 的 实际 
用 户 ID。 如 有 果 which 参 数 作 用 于 多 个 进程 ， 则 返回 所 有 作用 进程 中 优先 
级 最 高 的 〈 最 小 的 nice 值 ) 

setpriority 函 数 可 用 于 为 进程 、 进 程 组 和 属于 特定 用 户 ID 的 所 有 进 
程 设置 优先 级 。 


#include <sys/resource.h> 


int setpriority(int which, id_t who, int value); 
返回 值 : Aa, Reo; 者 出 错 ， 返 回 -1 
参数 which 和 who 与 getpriority 函 数 中 相同 。value 增 加 到 NZERO 上 ， 
SR Ic REOR nicef& ° 

nice 系统 调用 起 源 于 早期 Research UNIX 系统 的 PDP-11 版 本 。 
getpriority 和 setpriority 函 数 源 于 4.2BSD。 

Single UNIX Specification 没 有 对 在 fork 之 后 子 进 程 是 否 继承 nice 值 
制定 规则 ， 而 是 留 给 具体 实现 目 行 决定 。 但 是 遵循 XSI 的 系统 要 求 进程 
调用 exec 后 你 留 nice 值 。 

在 FreeBSD 8.0 ` Linux 3.2.0、MacOS X 10.6.8 以 及 Solaris 10 中 ， 子 
进程 从 父 进程 中 继承 nice 值 。 

实例 

图 8-30 的 程序 度量 了 调整 进程 nice 值 的 效果 。 两 个 进程 并 行 运行 ， 
各 目 增 加 目 己 的 计数 釉 。 父 进程 使 用 了 默认 的 nice 值 ， 子 进程 以 可 选 命 


令 参数 指定 的 调整 后 的 nice 值 运行 。 运 行 10 s 后 ， 两 个 进程 都 打印 各 上 自 
的 计数 值 并 终止 。 通 过 比较 不 同 nice 值 的 进程 的 计数 值 的 差异 ， 我 们 可 
以 了 解 nice 值 时 如 何 影响 进程 调度 的 。 


#include "apue.h" 
#include <errno.h> 
#include <sys/time.h> 


#if defined (MACOS) 
#include <sys/syslimits.h> 
#elif defined (SOLARIS) 
#include <limits.h> 

#elif defined(BSD) 
#include <sys/param.h> 
#endif 


unsigned long long count; 
struct timeval end; 


void 
checktime (char *str) 
{ 


struct timeval tv 


gettimeofday(&tv, NULL); 

if (tv.tv sec »- end.tv sec && tv.tv usec »- end.tv usec) 
printf("$s count = %lld\n", str, count); 
exit(0); 


) 


int 
main(int argc, char *argv[]) 
{ 

pid t pid; 


char NS 
int nzero, ret; 
int adj = 0; 


setbuf (stdout, NULL); 
#if defined (NZERO) 


nzero - NZERO; 
#elif defined( SC NZERO) 
nzero - sysconf( SC NZERO); 
#else 
#error NZERO undefined 
#endif 
printf ("NZERO = %d\n", nzero); 
if (argc == 2) 
adj = strtol(argv[1], NULL, 10); 
gettimeofday(&end, NULL); 
end.tv_sec += 10; /* run for 10 seconds */ 


if ((pid = fork()) < 0) { 
err_sys("fork failed"); 
} else if (pid == 0) { /* child */ 
S = "child"; 
printf("current nice value in child is %d, adjusting by %d\n", 
nice(0)+nzero, adj); 


errno = 0; 
if ((ret = nice(adj)) == -1 && errno != 0) 
err_sys("child set scheduling priority"); 
printf("now child nice value is %d\n", ret-tnzero); 
) else ( /* parent */ 
S — "parent"; 


printf("current nice value in parent is %d\n", nice(0)+nzero); 
} 
for(;;) { 
if (++count == 0) 
err quit("$s counter wrap", s); 
checktime (s); 


图 8-30 更 改 nice 值 的 效果 
执行 该 程序 两 次 : 一 次 用 默认 的 nice 值 ， 另 一 次 用 最 高 有 效 nice 值 
(最 低调 度 优先 级 ) 。 程 序 运 行 在 单 处 理 器 Linux 系 统 上 ， 以 显示 调度 
程序 如 何在 不 同 nice 值 的 进程 间 进 行 CPU 的 共享 。 否 则 ， 对 于 有 空 采 资 
源 的 系统 ， 如 多 处 理 器 系统 (或 多 核 CPU) ， 两 个 进程 可 能 无 需 共享 
CPU (运行 在 不 同 的 处 理 器 上 ) ,就 无 法 看 出 具有 不 同 nice 值 的 两 个 进 
程 的 差异 。 
$ ./a.out 
NZERO = 20 


current nice value in parent is 20 


current nice value in child is 20, adjusting by 0 

now child nice value is 20 

child count = 1859362 

parent count = 1845338 

$ ./a.out 20 

NZERO - 20 

current nice value in parent is 20 

current nice value in child is 20, adjusting by 20 

now child nice value is 39 

parent count = 3595709 

child count = 52111 

当 两 个 进程 的 nice 值 相同 时 ， 父 进程 占用 50.2% 的 CPU， 了 于 进程 占 
用 49.8% 的 CPU。 可 以 看 到 ， 两 个 进程 被 有 效 地 进行 了 平等 对 待 。 百 分 
比 并 不 完全 相同 ， 是 因为 进程 调度 并 不 精确 ， 而 且 子 进程 和 父 进程 在 
计算 结束 时 间 和 处 理 循 环 开始 时 间 之 间 执 行 了 不 同 数量 的 处 理 。 

相 比 之 下 ， 当 子 进程 有 最 高 可 能 nice 值 “最 低 优先 级 ) 时 ， 我 们 看 
到 父 进程 占用 98.59% 的 CPU， 而 子 进程 只 占用 1.5% 的 CPU。 这 些 值 取决 
于 进程 调度 程序 如 何 使 用 nice 值 ， 因 此 不 同 的 UNIX 系 统 会 产生 不 同 
的 CPU 占 用 比 。 


8.17 进程 时 间 


在 1.10 世 中 说 明了 我 们 可 以 度量 的 3 个 时 间 : 墙 上 时 钟 时 间 、 用 户 
CPU 时 间 和 系统 CPU 时 间 。 任 一 进程 都 可 调用 times 函 数 获得 它 目 己 以 
及 已 终止 子 进程 的 上 述 值 。 


#include <sys/times.h> 


clock t times(struct tms *buf)); 
返回 值 ， 若 成 功 ， 返 回流 逝 的 墙 上 时 钟 时 间 〈 以 时 钟 滴答 数 为 单 
位 ) ; 若 出 错 ， 返 回 -1 
此 函数 填写 由 buf 指 向 的 tms 结 构 ， 该 结构 定义 如 下 : 
struct tms { 
clock t tms utime; /* user CPU time */ 
clock t tms stime; /* system CPU time */ 
clock t tms cutime; /* user CPU time,terminated children */ 
clock t tms cstime; /* system CPU time,terminated children */ 
js 
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间作 为 其 函数 值 。 此 值 是 相对 于 过 去 的 某 一 时 刻度 量 的 ， 所 以 不 能 
其 绝对 值 而 必须 使 用 其 相对 值 。 例 如 ， 调 用 times， 保 存 其 运 回 值 。 在 
以 后 某 个 时 间 再 次 调用 times， 从 新 返回 的 值 中 减 去 以 前 返回 的 值 ， 此 
差 值 承 是 墙 上 时 钟 时 间 。 (一 个 长 期 运行 的 进程 可 能 其 墙 上 时 钟 时 间 
会 溢出 ， 当 然 这 种 可 能 性 极 小 ， 见 习题 1.5) 
该 结构 中 两 个 针对 子 进 程 的 字段 包含 了 此 进程 用 本 章 开 始 部 分 的 
wait 函 数 族 已 等 竺 到 的 各 子 进 程 的 值 。 
所 有 由 此 函数 返回 的 clock t 值 都 用 SC_CLK_TCK (由 sysconf EN 
数 返回 的 每 秒 时钟 滴 答 数 ， 见 2.5.4 节 ) 转换 成 秒 数 。 
大 多 数 实 现 提 供 了 getrusage(2) 函 数 ， 该 函数 返回 CPU 时 间 以 及 指 
示 资 源 使 用 情况 的 另外 14 个 值 。 它 起 源 于 BSD 系 统 ， 所 以 BSD 派 生 的 
实现 与 其 他 实现 比较 ， 文 持 的 字段 要 多 一 些 。 
实例 
图 8-31 中 的 程序 将 每 个 命令 行 参数 作为 shell 命 令 串 执行 ， 对 每 个 命 
令 计 时 ， 并 打印 从 tms 结 构 取 得 的 值 。 


#include "apue.h" 
#include <sys/times.h> 


static: void pr times(clock t, struct tms, *, struct tms *) ; 
static void do cmd(char *); 


int 


main(int argc, char *argv[]) 


{ 


int i; 


setbuf (stdout, NULL); 
for (i = 1; i < atgo; ict) 

do cmd(argv[i]); /* once for each command-line arg */ 
exit(0); 


static void 
do cmd(char *cmd) /* execute and time the "cmd" */ 


( 


struct tms tmsstart, tmsend; 
clock t start, end; 
int status; 


printf ("\ncommand: %s\n", cmd); 


if ((start = times(&tmsstart)) == -1) /* starting values */ 
err sys("times error"); 


if ((status = system(cmd)) « 0) /* execute command */ 
err sys("system() error"); 


if ((end = times(&tmsend)) == -1) /* ending values */ 
err sys("times error"); 


pr times(end-start, &tmsstart, &tmsend); 
pr exit(status); 


static void 
pr times(clock t real, struct tms *tmsstart, struct tms *tmsend) 


{ 


static long clktck = 0; 


if (clktck == 0) /* fetch clock ticks per second first time */ 
if ((clktck = sysconf( SC CLK TCK)) « 0) 
err sys("sysconf error"); 


printf(" real: %7.2f\n", real / (double) clktck); 
printf(" user: %7.2f\n", 

(tmsend-»tms utime - tmsstart-»tms utime) / (double) clktck); 
printf(" sys: TZENA", 

(tmsend-»tms stime - tmsstart-»tms stime) / (double) clktck); 
printf(" child user: %7.2f\n", 

(tmsend-»tms cutime - tmsstart->tms_cutime) / (double) clktck); 
printf(" child sys: STLENN; 

(tmsend->tms_cstime - tmsstart->tms_cstime) / (double) clktck); 


一 一 


运行 


图 8-31 计时 并 执行 所 有 命令 行 参数 
此 程序 可 以 得 到 : 


$ /a.out "sleep 5" "date" "man bash »/dev/null" 


command: sleep 5 
real: 5.01 
user: 0.00 
sys: 0.00 
child user: 0.00 
child sys: 0.00 


normal termination, exit status = 0 


command: date 


Sun Feb 26 18:39:23 EST 2012 


real: 0.00 

user: 0.00 

sys: 0.00 

child user: 0.00 
child sys: 0.00 


normal termination, exit status = 0 


command: man bash >/dev/null 


real: 1.46 

user: 0.00 

sys: 0.00 

child user: 1.32 
child sys: 0.07 


normal termination, exit status = 0 


MAA 


在 前 两 |^ Hl ew 
孙 CPU 时 间 。 但 在 第 3 


AA 
个 命令 


中 ， 命 令 执行 时 间 足 够 快 避免 了 以 可 报告 的 精度 记 


中 ， 运 行 了 一 个 处 理 时 间 足 够 长 的 命令 来 


表明 所 有 的 CPU 时 间 都 出 现在 子 进程 中 ， 而 shell 和 命令 正 是 在 子 进程 中 
执行 的 。 


8.18 小 结 


对 在 UNIX 环 境 中 的 高 级 编程 而 言 ， 完 整地 了 解 UNIX 的 进程 控制 
是 非常 重要 的 。 其 中 必须 熟练 掌握 的 只 有 几 个 函数 一 fork 、exec 系 列 、 
_exit、wait 和 waitpid。 很 多 应 用 程序 都 使 用 这 些 人 简单 的 函数 。fork 函 数 
也 给 了 我 们 一 个 了 解 竞争 条 件 的 机 会 。 

本 章 说 明了 system 芳 数 和 进程 会 计 ， 这 也 使 我 们 能 进一步 了 解 所 有 
这 些 进程 控制 函数 。 本 章 还 说 明了 exec 男 数 的 男 一 种 变 体 ， 解释 器 文件 
及 它们 的 工作 方式 。 对 各 种 不 同 的 用 户 ID 和 组 ID (实际 、 有 效 和 保存 
HJ) 的 理解 ， 对 编写 安全 的 设置 用 户 ID 程序 是 至 关 重 要 的 。 

在 了 解 进程 和 子 进 程 的 基础 上 ， 下 一 章 将 进一步 说 明 进 程 和 其 他 
进程 的 关系 会 话 和 作业 控制 。 第 10 章 将 说 明 信 和 号 机 制 并 以 此 结 
对 进程 的 讨论 。 


习题 


8.1 在 图 8-3 程 序 中 ， 如 果 用 exit 调 用 代替 _exit 调 用 ， 那 么 可 能 会 使 
标准 输出 关闭 ， 使 printf 返 回 -1。 修 改 该 程序 以 验证 在 你 所 使 用 的 系统 
上 是 否 会 产生 此 种 结果 。 如 果 并 非 如 此 ， 你 怎样 处 理 才能 得 到 类 似 结 
果 呢 ? 

8.2 回忆 图 7-6 中 典型 的 存储 空间 布局 。 由 于 对 应 于 每 个 函数 调用 的 
栈 帧 通常 存储 在 栈 中 ， 并 且 由 于 调用 vfork 后 ， 子 进程 运行 在 父 进程 的 


地 址 空间 中 ， 如 果 不 是 在 main 函 数 中 而 是 在 另 一 个 函数 中 调用 vfork， 
此 后 子 进 程 又 从 该 函数 返回 ， 将 会 发 生 什 么 ? 请 编写 一 段 测试 程序 对 
此 进行 验证 ， 并 且 画 图 说 明 发 生 了 什么 。 

8.3 重 写 图 8-6 中 的 程序 ， 把 wait 换 成 waitid。 不 调用 pr_exit， 而 从 
siginfo 结 构 中 确定 等 价 的 信息 。 

8.4 当 用 $./a.out 执行 图 8-13 中 的 程序 一 次 时 ， 其 输出 是 正确 的 。 
但 是 若 将 该 程序 按 下 列 方式 执行 多 次 ， 则 其 输出 不 正确 。 

$ ./a.out ; a.out ;./a.out 

output from parent 

ooutput from parent 

ouotuptut from child 

put from parent 

output from child 

utput from child 

原因 是 什么 ? 怎样 才能 更 正 此 类 错误 ?” 如果 使 子 进程 首先 输出 ， 
还 会 发 生 此 问题 吗 ? 

8.5 在 图 8-20 所 示 的 程序 中 ， 调 用 execl， 指 定 pathname 为 解释 器 
文件 。 如 果 将 其 改 为 调用 execlp， 指 定 testinterp 的 filename， 并 且 如 有 果 目 
录 /home/sar/bin 是 路 径 前 级 ， 则 运行 该 程序 时 ，argv[2] 的 打印 输出 是 什 
2 

8.6 编写 一 段 程序 创建 一 个 僵 死 进程 ， 然 后 调用 system 执 行 ps(T) 命 
令 以 验证 该 进程 是 僵 死 进程 。8.7 8.10 节 中 提 及 POSIX.1 要 求 在 exec 时 关 
闭 打 开 目 隶 流 。 按 下 列 方法 对 此 进行 验证 ， 对 根 目 隶 调 用 opendir， 和 但 
看 在 你 系统 上 实现 的 DIR 结 构 ， 然 后 打印 执行 时 关闭 标志 。 接 着 打开 同 
一 目录 读 并 打印 执行 时 关闭 标志 。 


在 上 一 章 我 们 已 了 解 到 进程 之 间 具 有 关系 。 首 先 ， 每 个 进程 有 一 
个 父 进程 (初始 的 内 核 级 进程 通常 是 自己 的 父 进程 ;。 当 子 进程 终止 
时 ， 父 进程 得 到 通知 并 能 取得 子 进程 的 退出 状态 。 在 8.6 市 说 明 waitpid 
函数 时 ， 我 们 也 提 到 了 进程 组 ， 以 及 如 何等 竺 进程 组 中 的 任意 一 个 进 
FEIE ° 

本 章 将 更 详细 地 说 明 进 程 组 以 及 POSIX.1 引 入 的 会 话 的 概念 。 还 将 
介绍 登录 shell (登录 时 所 调用 的 ) 和 所 有 从 登录 shell 启 动 的 进程 之 间 的 

在 说 明 这 些 关 系 时 不 可 能 不 谈 及 信和 号， 而 讨论 信号 时 又 需要 很 多 
本 章 介绍 的 概念 。 如 果 你 不 熟悉 UNIX 系 统 信 号 机 制 ， 则 可 能 先 要 浏览 
一 下 第 10 章 。 


9.2 终端 登录 


先 说 明 当 我 们 登录 到 UNIX 系 统 时 所 执行 的 各 个 程序 。 在 早期 的 
UNIX 系 统 (如 V7) 中 ， 用 户 用 哑 终 端 (用 硬 连 接连 到 主机 ) 进行 登 
录 。 终 端 或 者 是 本 地 的 (直接 连接 ) 或 者 是 远程 的 (通过 调制 解 调 器 


连接 ) 。 在 这 两 种 情况 下 ， 登 录 都 经 由 内 核 中 的 终端 设备 驱动 程序 。 
例如 ， 在 PDP-11 上 常用 的 设备 是 DH-11 和 DZ-11。 因 为 连 到 主机 上 的 终 
端 设 备 数 是 固定 的 ， 所 以 同时 的 登录 数 也 就 有 了 已 知 的 上 限 。 

随 着 位 映射 图 形 终端 的 出 现 ， 开 发 出 了 窗口 系统 ， 它 向 用 户 提供 
了 与 主机 系统 进行 交互 的 新 方式 。 创 建 终 端 窗口 的 应 用 也 被 开发 出 
来 ， 它 仿真 了 基于 字符 的 终端 ， 使 得 用 户 可 以 用 熟悉 的 方式 ( 即 通 过 
shell 命 令 行 ) 与 主机 进行 交互 。 

现今 ， 某 些 平台 允许 用 户 在 登录 后 启动 一 个 窗口 系统 ， 而 男 一 些 
平台 则 自动 为 用 户 启动 窗口 系统 。 在 后 面 一 种 情况 中 ， 用 户 可 能 仍然 
需要 登录 ， 这 取决 于 窗口 系统 是 如 何 配置 的 〈 某 些 窗口 系统 可 被 配置 
成 自动 为 用 户 登 录 ) 。 

我 们 现在 描述 的 过 程 用 于 经 由 终端 登录 至 UNIX 系 统 。 该 过 程 几 乎 
与 所 使 用 的 终端 类 型 无 关 ， 所 使 用 的 终端 可 以 是 基于 字符 的 终端 、 仿 
真 基 于 字符 终端 的 图 形 终端 ， 或 者 运行 窗口 系统 的 图 形 终端 。 

1. BSD 终 端 登录 

在 过 去 35 年 中 ，BSD 终端 登 沙 过程 并 没有 多 少 改变 。 系 统管 理 者 
创建 通常 名 为 /etc/ttys 的 文件 ， 其 中 ， 每 个 终端 设备 都 有 一 行 ， 每 一 行 
说 明 设 备 名 和 传 到 getty 程序 的 参数 。 例 如 ， 其 中 一 个 参数 说 明了 终端 
的 波 特 率 等 。 当 系统 自 举 时 ， 内 核 创建 进程 ID 为 1 的 进程 ， 也 就 是 init 
进程 。init 进 程 使 系统 进入 多 用 户 模 式 。init 读 取 文 件 /etc/ttys， 对 每 一 个 
允许 登录 的 终端 设备 ，init 调 用 一 次 fork， 它 所 生成 的 子 进程 则 exec 
getty 程 序 。 这 种 情况 示 于 图 9-1 中 。 

图 9-1 中 所 有 进程 的 实际 用 户 ID 和 有 效用 户 ID 都 是 0 〈 也 就 是 说 ， 
它们 都 具有 超级 用 户 特权 ) 。init 以 空 环境 exec getty 程 序 。 

getty 对 终端 设备 调用 open 函数 ， 以 读 、 写 方式 将 终端 打开 。 如 果 
设备 是 调制 解 调 器 ， 则 open 可 能 会 在 设备 张 动 程序 中 滞留 ， 直 到 用 户 
拨号 调制 解 调 器 ， 并 且 线 路 被 接 通 。 一 旦 设备 被 打开 ， 则 文件 描述 符 


0、1、2 束 被 设置 到 该 设备 。 然 后 getty 输 出 “login: ”之 类 的 信息 ， 并 等 
待 用 户 键入 用 户 名 。 如 果 终 端 文 持 多 种 速度 ， 则 getty 可 以 测试 特殊 字 
符 以 便 适 当地 更 改 终端 速度 ( 波 特 率 ) 。 关 于 getty 程 序 以 及 有 关 数 据 
文件 (gettytab) 的 细节 ， 请 参阅 UNIX 系 统 手册 。 

当 用 户 键入 了 用 户 名 后 ，getty 的 工作 就 完成 了 。 然 后 它 以 类 似 于 
下 列 的 方式 调用 login 程 序 : 

execle("/bin/login", "login", "-p", username, (char *)0, envp); 

(在 gettytab 文 件 中 可 能 会 有 一 些 选 项 使 其 调用 其 他 程序 ， 但 系统 
默认 是 login 程 序 ) 。init 以 一 个 空 环境 调用 getty。getty 以 终端 名 (如 
TERM=foo， 其 中 终端 foo 的 类 型 取 自 gettytab 文 件 ) 和 在 gettytab 中 说 明 
的 环境 字符 串 为 login 创 建 一 个 环境 (envp 参 数 ) 。-p 标 志 通 知 login 保 
留 传递 给 它 的 环境 ， 也 可 将 其 他 环境 字符 串 加 到 该 环境 中 ， 但 是 不 要 
楼 换 它 。 图 9-2 显 示 了 login 刚 被 调用 后 这 些 进 程 的 状态 。 


进程 ID 1 


每 个 终端 执行 
ik fork 


E 每 个 了 进程 


exec getty 


图 9-1 为 允许 终端 登录 ，init 调 用 的 进程 


进程 ID 1 


读 取 /etc/ttys 
peA ed- 次 fork 
境 


fork 


打开 终端 设备 

(文件 描述 符 0, 1, 2); 
读 用 户 名 

初始 环境 集 


图 9-2 login 调 用 后 进程 的 状态 


因为 最 初 的 init 进 程 具有 超级 用 户 特权 ， 所 以 图 9-2 中 的 所 有 进程 都 
有 超级 用 户 特 权 。 图 9-2 中 底部 3 个 进程 的 进程 ID 相 同 ， 因 为 进程 ID 不 
会 因 执 行 exec 而 改变 。 并 且 ， 除 了 最 初 的 init 井 程 ， 所 有 进程 的 父 进程 
ID 均 为 1。 

login 能 处 理 多 项 工作 。 因 为 它 得 到 了 用 户 名 ， 所 以 能 调用 
getpwnam 取得 相应 用 户 的 口令 文件 登录 项 。 然 后 调用 getpass(3) 以 显示 
提示 “Password: ”， 接 着 读 用 户 键入 的 口令 (上 自然 ， 禁止 回 显 用 户 键入 
的 口令 ) 。 它 调用 crypt(3) 将 用 户 键入 的 口令 加 密 ， 并 与 该 用 户 在 阴影 
口令 文件 中 登录 项 的 pw_passwd 字 段 相 比 较 。 如 果 用 户 几 次 键入 的 口令 
都 无 效 ， 则 login 以 参数 1 调用 exit 表 示 登 录 过 程 失败 。 父 进程 (ni) 了 


解 到 子 进程 的 终止 情况 后 ， 将 再 次 调用 fork， 其 后 又 执行 了 getty， 对 此 
终端 重复 上 述 过 程 。 

这 是 UNIX 系 统 传统 的 用 户 号 份 验证 过 程 。 现 代 UNIX 系 统 已 发 展 

到 文 持 多 个 号 份 验 证 过 程 。 例 如 ，EFreeBSD、Linux、Mac OS X 以 及 
Solaris 都 支持 被 称 为 PAM (Pluggable Authentication Modules， 可 插入 
的 身份 验证 模块 ) 的 更 加 灵活 的 方案 。PAM 允许 管理 人 员 配 置 使 用 何 
种 身份 验证 方法 来 访问 那些 使 用 PAM 库 编写 的 服务 。 

如 果 应 用 程序 需要 验证 用 户 是 否 具 有 适当 的 权限 去 执行 某 个 服 

务 ， 那 么 我 们 要 么 将 身份 验证 机 制 编写 到 应 用 中 ， 要 么 使 用 PAM 库 得 
到 同样 的 功能 。 使 用 PAM 的 优点 是 ， 管 理 员 可 以 基于 本 地 策略 、 针 对 
不 同 任务 配置 不 同 的 验证 用 户 喘 份 的 方法 。 

如 果 用 户 正确 登录 ，login 就 将 完成 如 下 工作 。 

“将 当前 工作 目录 更 改 为 该 用 户 的 起 始 目录 (chdir) ° 

“调用 chown 更 改 该 终端 的 所 有 权 ， 使 登录 用 户 成 为 它 的 所 有 者 。 

将 对 该 终端 设备 的 访问 权限 改变 成 < 用户 读 和 写 ”。 

“调用 setgid 及 initgroups 设 置 进 程 的 组 ID。 

“用 login 得 到 的 所 有 信息 初始 化 环境 : 起 始 目录 (HOME) ^ shell 
(SHELL) 、 用 户 名 (USER 和 LOGNAME) 以 及 一 个 系统 默认 路 径 
(PATH) 。 

“login 进 程 更 改 为 登录 用 户 的 用 户 ID (setuid) 并 调用 该 用 户 的 登录 

shell， 其 方式 类 似 于 : execl("/bin/sh", "-sh", (char *)0); 
argv[0] 的 第 一 个 字符 负 号 “-” 是 一 个 标志 ， 表 示 该 shell 被 作为 登录 
shell 调 用 。shell 可 以 查看 此 字符 ， 并 相应 地 修改 其 启动 过 程 。 
login 程 序 实际 所 做 的 比 上 面 说 的 要 多 。 它 可 选择 地 打印 日 期 消息 
(message-of-the-day) 文件 、 检 查 新 邮件 以 及 执行 其 他 一 些 任务 。 本 章 
中 我 们 主要 关心 上 面 所 说 的 功能 。 


回忆 8.11 节 中 对 setuid 函 数 的 讨论 ， 因 为 setuid 是 由 超级 用 户 调用 
的 ， 它 更 改 所 有 3 个 用 户 ID: 实际 用 户 ID、 有 效用 户 ID 和 保存 的 用 户 
ID。login 在 较 早 时 间 调 用 的 setgid 对 所 有 3 个 组 ID 也 有 同样 效果 。 

至 此 ， 登 录用 户 的 登录 shell 开 始 运行 。 其 父 进程 ID 是 initj 井 程 ( 进 
程 ID 1) ， 所 以 当 此 登录 shell 终 止 时 ，init 会 得 到 通知 〈 接 到 SIGCHLD 
信号 ) ， 它 会 对 该 终端 重复 全 部 上 述 过 程 。 登 录 shell 的 文件 描述 符 0、 


1 和 2 设置 为 终端 设备 。 图 9-3 显 示 了 这 种 安排 。 
进程 ID 1 


init 


通过 getty 和 login 


登录 shell 


fd 0, 1,2 


终端 设备 驱动 


硬 连接 


图 9-3 终端 登录 完成 各 种 设置 后 的 进程 安排 


现在 ， 登 录 shell 读 取 其 启动 文件 (Bourne shell 和 Korn shell 
是 .profile , GNU Boume-again shell 7 .bash profile ^ .bash login 


或 .profile， C shell 是 .cshrc 和 .login) 。 这 些 启动 文件 通常 更 改革 些 环境 
变量 并 增加 很 多 环境 变量 。 例 如 ， 大 多 数 用 户 设 置 他 们 自己 的 PATH 
并 常常 提示 实际 终端 类 型 (TERM) 。 当 执行 完 启 动 文件 后 ， 用 户 最 后 
得 到 shell 提 示人 符 ， 并 能 键入 命令 。 

2. Mac OS X 终 端 登 录 

Mac OS X 部 分 地 基于 FreeBSD， 所 以 其 终端 登录 进程 与 BSD 终 端 
登录 进程 的 工作 步 又 基本 相同 。 但 是 ，Mac OS X 有 些 不 同 之 处 。 

“init 的 工作 是 由 launchd 完 成 的 。 

一 开始 提供 的 就 是 图 形 终端 。 

3. Linux 终 端 登录 

Linux 的 终端 登录 过 程 非常 类 似 于 BSD。 确 实 ，Linux login 命 令 是 
从 4.3BSD login 命 令 派生 出 来 的 。BSD 登 录 过 程 与 Linux 登 录 过 程 的 主要 
区 别 在 于 说 明 终 端 配置 的 方式 。 

在 System V 的 init 文 件 格 式 之 后 ， 有 些 Linux 发 行 版 的 init 程 序 使 用 
了 管理 文件 方式 。 在 这 些 系统 中 ，/etcinittab 包 含 配 置信 息 ， 指 定 了 init 
应 当 为 之 局 动 getty 进 程 的 各 终端 设备 。 

其 他 Linux 发 行 版 本 ， 如 最 近 的 Ubuntu 发 行 版 ， 配 有 称 为 “Upstart” 
的 init 程 序 。 使 用 存放 在 /etc/init 目 录 的 *.conf 命 名 的 配置 文件 。 例 如 ， 
运行 /dev/ttyl 上 的 getty 需 要 的 说 明 可 能 放 在 /etc/init/tty1.conf 文 件 中 。 

根据 所 使 用 的 getty 版 本 的 不 同 ， 终 端的 特征 要 么 在 命令 行 中 说 明 

(如 agetty) ， 要 么 在 /etc/gettydefs 文 件 中 说 明 (如 mgetty) ° 

4. Solaris 终 端 登录 

Solaris 支 持 两 种 形式 的 终端 登录 (a) getty 方 式 ， 这 与 前 面 对 
BSD 终 端 登 录 的 说 明 一 样 ， (b) ttymon 登 录 ， 这 是 SVR43 引 入 的 一 种 新 
特性 。 通 常 ，getty 用 于 控制 台 ，ttymon 则 用 于 其 他 终端 的 登录 。 

ttymon 命 令 是 服务 访 间 设施 (Service Access Facility, SAF) 的 一 
部 分 。SAF 的 目的 是 用 一 致 的 方式 对 提供 系统 访问 的 服务 进行 管理 CX 


于 SAF 的 详细 信息 可 以 参见 Rago[1993] 的 第 6 章 ) 。 按 照 本 书 的 宗旨， 
我 们 只 简单 说 明 从 init 到 登录 shell 之 则 不 同 的 工作 步 台 ， 最 后 结果 与 图 
9-3 中 所 示 相 似 。init 是 sac (service access controller， 服 务 访问 控制 器 ) 
的 父 进 程 ，sac 调 用 fork， 然 后 ， 当 系统 进入 多 用 户 状 态 时 ， 其 子 进程 
执行 tymon 程 序 。ttymon 监 控 在 配置 文件 中 列 出 的 所 有 终端 端口 ， 当 用 
户 键入 登录 名 时 ， 它 调用 一 次 fork。 在 此 之 后 ttymon 的 子 进程 执行 
login， 它 向 用 户 发 出 提示 ， 要 求 输入 口令 字 。 一 旦 完成 这 一 处 理 ， 
login 执 行 登 录用 户 的 登录 shell， 于 是 到 达 了 图 9-3 中 所 示 的 位 置 。 一 个 
区 别 是 用 户 登 录 shell 的 父 进 程 现在 是 ttymon， 而 在 getty 登 录 中 ， 登 录 
shell 的 父 进程 是 init ° 


9.3 网 络 登 


通过 串 行 终端 登 示 至 系统 和 经 由 网 络 登 录 至 系统 两 者 之 间 的 主要 

(物理 上 的 ) 区 别 是 : 网 络 登 录 时 ， 在 终端 和 计算 机 之 间 的 连接 不 再 

是 点 到 点 的 。 在 网 络 登 录 情 况 下 ，login 仅 仅 是 一 种 可 用 的 服务 ， 这 与 
其 他 网 络 服务 (如 FTP 或 MTP) 的 性 质 相同 。 

在 上 下 所 述 的 终端 登录 中 ，init 知 道 哪些 终端 设备 可 用 来 进行 登 
录 ， 并 为 每 个 设备 生成 一 个 getty 进 程 。 但 是 ， 对 网 络 登 录 情 况 则 有 所 
不 同 ， 所 有 登录 都 经 由 内 核 的 网 络 接口 驱动 程序 (如 以 太 网 驱动 程 
Fe) ， 而 且 事 先 并 不 知道 将 会 有 多 少 这 样 的 登录 。 因 此 必须 等 待 一 个 
网 络 连 接 请 求 的 到 达 ， 而 不 是 使 一 个 进程 等 竺 每 一 个 可 能 的 登录 。 

为 使 同一 个 软件 既 能 处 理 终 剖 登录 ， 叉 能 处 理 网 络 登 录 ， 系 统 使 
用 了 一 种 称 为 伪 终 端 (pseudo terminal) 的 软件 驱动 程序 ， 它 仿真 串 行 
终端 的 运行 行为 ， 并 将 终端 操作 映射 为 网 络 操 作 ， 反 之 亦 然 。 (在 第 
19 章 ， 我 们 将 详细 说 明 伪 终端 。) 


1. BSD 网 络 登录 

在 BSD 中 ， 有 一 个 inetd 进 程 《有 时 称 为 因特网 超级 服务 器 ) . E 
等 待 大 多 数 网 络 连 接 。 本 节 将 说 明 BSD 网 络 登 录 中 所 涉及 的 进程 序 
列 。 关 于 这 些 进 程 的 网 络 程序 设计 方面 的 细节 请 参阅 Stevens、Fenner 
和 Rudoff [2004] 。 

作为 系统 启动 的 一 部 分 ，init 调 用 一 个 shell ， 使 其 执行 shell 脚 
本 /etcirc。 由 此 shell 脚 本 局 动 一 个 守护 进程 inetd。 一 旦 此 shell 脚 本 终 
止 ，inetd 的 父 进程 就 变 成 init。inetd 等 待 TCP/IP 连 接 请 求 到 达 主 机 ， 而 
当 一 个 连接 请 求 到 达 时 ， 它 执行 一 次 fork， 然 后 生成 的 子 进程 exec 适 当 
的 程序 。 

假定 一 个 对 于 TELNET 服 务 进程 的 TCP 连 接 请 求 到 达 。TELNET 是 
使 用 TCP 协 议 的 远程 登录 应 用 程序 。 在 另 一 台 主 机 ( 它 通过 某 种 形式 的 
网 络 与 服务 进程 主机 相连 接 ) 上 的 用 户 ， 或 在 同一 个 主机 上 的 一 个 用 
户 局 动 TELNET 客 户 进程 ， 由 此 局 动 登录 过 程 : 

telnet hostname 

该 客户 进程 打开 一 个 到 hostname 主 机 的 TCP 连 授 ， 在 hosthame 主 机 
上 启动 的 程序 被 称 为 TELNET 服 务 进程 。 然 后 ， 客 户 进程 和 服务 进程 之 
间 使 用 TELNET 应 用 协议 通过 TCP 连 接 交 换 数 据 。 局 动 客户 进程 的 用 户 
现在 登录 到 了 服务 进程 所 在 的 主机 (当然 ， 假 定 用 户 在 服务 进程 主机 
上 有 一 个 有 效 的 账号 ) 。 图 9-4 显 示 了 在 执行 TELNET 服 务 进程 〈 称 为 
telnetd) 中 所 涉及 的 进程 序列 。 


进程 ID 1 


lara: j 从 TELNET 客户 进程 来 


/bin/sh 中 的 fork/exec, 


系统 出 现 多 用 户 时 ， 
执行 shell 脚本 etc/rc 


从 TELNET 客户 进程 来 的 
TCP 连接 请 求 


的 连接 请 求 到 达 时 


图 9-4 执行 TELNET 服 务 进程 时 调用 的 进程 序列 


然后 ，telnetd 进 程 打 开 一 个 伪 终 端 设备 ， 并 用 fork 分 成 两 个 进程 。 
父 进 程 处 理 通过 网 络 连接 的 通信 ， 子 进程 则 执行 login 程 序 。 父 进程 和 
子 进 程 通过 伪 终 端 相 连接 。 在 调用 exec 之 前 ， 子 进程 使 其 文件 描述 符 
0、1、2 与 仿 终 端 相连 。 如 果 登 录 正 确 ，login 束 执行 9.2 下 中 所 述 的 同样 
步骤 一 更 改 当 前 工作 目录 为 起 始 目 孙 、 设 置 登录 用 户 的 组 ID、 用 户 ID 
以 及 初始 环境 。 然 后 login 调 用 exec 将 其 目 身 蔡 换 为 登录 用 户 的 登录 
shell。 图 9-5 显 示 了 到 达 这 一 点 时 的 进程 安排 。 


进程 ID1 


登录 shell 


fd 0, 1,2 


通过 inetd, telnetd, 
Ail login 


通过 telneta 服务 和 
telnet 客户 的 网 络 链接 


图 9-5 网 络 登 录 完 成 各 种 设置 后 的 进程 安排 

很 明显 ， 在 伪 终 端 设备 张 动 程序 和 实际 终端 用 户 之 间 进 行 了 很 多 
工作 。 第 19 章 详细 说 明 伪 终端 时 ， 我 们 将 介绍 与 这 种 安排 相关 的 所 有 
进程 。 

需要 理解 的 重点 是 : 当 通 过 终端 ( 见 图 9-3) 或 网 络 〈 见 图 9-5) Xt 
录 时 ， 我 们 得 到 一 个 登录 shell， 其 标准 输入 、 标 准 输出 和 标准 错误 要 
么 连接 到 一 个 终端 设备 ， 要 久 连 接 到 一 个 仿 终 端 设备 上 。 在 后 面 几 节 
中 我 们 会 了 解 到 这 一 登录 shell 是 一 个 POSIX.1 会 话 的 开始 ， 而 此 终端 或 
伪 终 端 则 是 会 话 的 控制 终端 。 

2. Mac OS X 网 络 登 录 


Mac OS X 是 部 分 地 基于 FreeBSD 的 ， 所 以 其 网 络 登录 与 BSD 网 络 
登录 基本 相同 。 但 Mac OS X 上 telnet 和 守护 进程 是 从 launchd 运 行 的 。 

telnet 守 护 进 程 在 Mac OS X 中 默认 是 禁用 的 (虽然 可 以 通过 
launchctl(1) 命 令 启用 ) ° Mac OS X 上 执行 网 络 登 录 的 更 好 办 法 是 用 使 
ssh (安全 shell 命 令 ) 。 

3. Linux 网 络 登 录 

除了 有 些 版 本 使 用 扩展 的 因特网 服务 守护 进程 xinetd 代 蔡 inetd 进 程 
外 ，Linux 网 络 登 录 的 其 他 方面 与 BSD 网 络 登 录 相 同 。xinetd 进 程 对 它 所 
启动 的 各 种 服务 的 控制 比 inetd 提 供 的 控制 更 加 精细 。 

4. Solaris 网 络 登 录 

Solaris 中 网 络 登 录 的 工作 过 程 与 BSD 和 Linux 中 的 步 又 几乎 一 样 。 
同样 使 用 了 类 似 于 BSD 版 的 inetd 服 务 进 程 ， 但 是 在 Solaris 中 ，inetd 服 务 
进程 在 服务 管理 设施 (Service Management Facility, SMF) 下 作为 
restarter 运 行 。 这 个 restarter 是 守护 进程 ， 它 负责 启动 和 监视 其 他 守护 进 
程 ， 如 果 其 他 守护 进程 失败 的 话 ，restarter 重 局 这 些 失效 进程 。 虽 然 
inetd 服务 程序 由 SMF 中 的 主 restarter 启 动 ， 但 实际 上 主 restarter 是 由 init 
程序 启动 的 ， 最 后 得 到 的 结果 与 图 9-5 中 一 样 。 

Solaris 服 务 管理 设施 是 管理 和 监视 系统 服务 的 框架 ， 提 供 了 一 种 从 
影响 系统 服务 的 故障 中 恢复 的 途径 。 关 于 服务 管理 设施 的 更 多 内 容 ， 
可 参阅 Adams[2005] 以 及 Solaris 系 统 手册 smf(5) 和 inetd(1M)。 


9.4 进程 组 


每 个 进程 除了 有 一 进程 ID 之 外 ， 还 属于 一 个 进程 组 ， 第 10 章 讨论 
信号 时 还 会 涉及 进程 组 。 


进程 组 是 一 个 或 多 个 进程 的 集合 。 通 常 ， 它 们 是 在 同一 作业 中 结 
合 起 来 的 (9.8 节 将 详细 讨论 作业 控制 ) ， 同 一 进程 组 中 的 各 进程 接收 
来 自 同一 终端 的 各 种 信号 。 每 个 进程 组 有 一 个 唯一 的 进程 组 ID。 进程 
ZA ID (WT wt EID 它 是 一 个 正 整数 ， 并 可 存放 在 pid_t 数 据 类 型 
中 。 函 数 getpgrp 返 回调 用 进程 的 进程 组 ID © 

#include <unistd.h> 


pid_t getpgrp(void); 


返回 值 : 调用 进程 的 进程 组 ID 
在 早期 BSD 派生 的 系统 中 ， 该 国 数 的 参数 是 pid， 返 回 该 进程 的 
进程 组 ID。Single UNIX Specification 定 义 了 getpgid 函 数 模 仿 此 种 运行 
行为 。 
#include <unistd.h> 
pid_t getpgid(pid_t pid); 
返回 值 : 者 成 功 ， 返 回 进程 组 ID; ate, we- 
大 pid 是 0， 返 回调 用 进程 的 进程 组 ID， 于 是， 
getpgid(0); 
等 价 于 
getpgrpO; 
每 个 进程 组 有 一 个 组 长 进程 。 组 长 进程 的 进程 组 ID 等 于 其 进程 
ID ? 
进程 组 组 长 可 以 创建 一 个 进程 组 、 创 建 该 组 中 的 进程 ， 然 后 终 
止 。 只 要 在 某 个 进程 组 中 有 一 个 进程 存在 ， 则 该 进程 组 就 存在 ， 这 与 
其 组 长 进程 是 否 终止 无 关 。 从 进程 组 创建 开始 到 其 中 最 后 一 个 进程 离 
开 为 止 的 时 间 区 间 称 为 进程 组 的 生命 期 。 某 个 进程 组 中 的 最 后 一 个 进 
程 可 以 终止 ， 也 可 以 转移 到 另 一 个 进程 组 。 
进程 调用 setpgid 可 以 加 入 一 个 现 有 的 进程 组 或 者 创建 一 个 新 进程 
组 《下 一 节 中 将 说 明 用 setsid 也 可 以 创建 一 个 新 的 进程 组 ) c 


#include <unistd.h> 
int setpgid(pid_t pid, pid_t pgid); 
REE: ERD, Eo; Aht, RE- 

setpgid 函 数 将 pid 进 程 的 进程 组 ID 设置 为 pgid。 如 果 这 两 个 参数 相 
等 ， 则 由 pid 指 定 的 进程 变 成 进程 组 组 长 。 如 果 pid 是 0， 则 使 用 调用 者 
的 进程 ID 。 另 外 ， 如 果 pgid 是 0， 则 由 pid 指 定 的 进程 ID 用 作 进 程 组 ID。 

一 个 进程 只 能 为 它 目 己 或 它 的 子 进 程 设 置 进程 组 ID。 在 它 的 子 进 
程 调用 了 exec 后 ， 它 残 不 再 更 改 该 子 进程 的 进程 组 ID。 

在 大 多 数 作业 控制 shel 中 ， 在 fork 之 后 调用 此 函数 ， 使 父 进程 设置 
其 子 进 程 的 进程 组 ID， 并 且 也 使 子 进程 设置 其 目 己 的 进程 组 ID。 这 两 
个 调用 中 有 一 个 是 元 余 的 ， 但 让 父 进程 和 子 进 程 都 这 样 做 可 以 保证 ， 
在 父 进程 和 子 进程 认为 子 进 程 已 进入 了 该 进程 组 之 前 ， 这 确实 已 经 发 
生 了 。 如 果 不 这样 做 ， 在 fork 之 后 ， 由 于 父 进程 和 子 进 程 运行 的 先后 次 
序 不 确定 ， 会 因为 子 进程 的 组 员 身 份 取决 于 哪个 进程 首先 执行 而 产生 
竞争 条 件 。 

在 讨论 信号 时 ， 将 说 明 如 何 将 一 个 信号 发 送 给 一 个 进程 (由 其 进 
程 ID 标识 ) 或 发 送 给 一 个 进程 组 “由 进程 组 ID 标识 ) o Ri, 8.675 
的 waitpid 函 数 可 被 用 来 等 待 一 个 进程 或 者 指定 进程 组 中 的 一 个 进程 终 
上 o 


9.5 St 


Sik (session) 是 一 个 或 多 个 进程 组 的 集合 。 例 如 ， 可 以 具有 图 
9-6 中 所 示 的 安排 。 其 中 ， 在 一 个 会 话 中 有 3 个 进程 组 。 


r a pd i sms n Codice demere aide l ~ m = = 
| | 
, 登录 shell procl proc2 | proc3 | | proc4 
| 
进程 组 进程 组 
进程 组 
会 话 


图 9-6 进程 组 和 会 话 中 的 进程 安排 

通常 是 由 shell 的 管道 将 几 个 进程 编 成 一 组 的 。 例 如 ， 图 9-6 中 的 安 
排 可 能 是 由 下 列 形式 的 shell 命 令 形成 的 : 

procl | proc2 & 


proc3 | proc4 | proc5 
进程 调用 setsid 函 数 建立 一 个 新 会 话 。 
#include <unistd.h> 
pid_t setsid(void); 
返回 值 : 者 成功 ， 返 回 进程 组 ID; ita, e- 
如 果 调 用 此 函数 的 进程 不 是 一 个 进程 组 的 组 长 ， 则 此 函数 创建 一 
个 新 会 话 。 具 体会 发 生 以 下 3 件 事 。 
(1) 该 进程 变 成 新 会 话 的 会 话 首 进程 (session leader， 会 话 首 进 
程 是 创建 该 会 话 的 进程 ) 。 此 时 ， 该 进程 是 新 会 话 中 的 唯一 进程 。 
(2) 该 进程 成 为 一 个 新 进程 组 的 组 长 进程 。 新 进程 组 ID 是 该 调用 
进程 的 进程 ID 。 
(3) 该 进程 没有 控制 终端 (下 一 节 讨 论 控 制 终端 。 如 果 在 调用 
setsid 之 前 该 进程 有 一 个 控制 终端 ， 那 么 这 种 联系 也 被 切断 。 
如 果 该 调用 进程 已 经 是 一 个 进程 组 的 组 长 ， 则 此 函数 返回 出 钳 。 
为 了 你 证 不 处 于 这 种 情况 ， 通 音 先 调用 fork， 然 后 使 其 父 进程 终止 ， 而 


子 进程 则 继续 。 因 为 子 进程 继承 了 父 进程 的 进程 组 ID ， 而 其 进程 ID 则 
是 新 分 配 的 ， 两 者 不 可 能 相等 ， 这 就 保证 了 子 进程 不 是 一 个 进程 组 的 
组 长 。 

Single UNIX Specification 只 说 明了 会 话 百 进程 ， 而 没有 类 似 于 进程 
ID 和 进程 组 ID 的 会 话 ID。 显 然 ， 会 话 首 进 程 是 具有 唯一 进程 ID 的 单个 
进程 ， 所 以 可 以 将 会 话 首 进程 的 进程 ID 视 为 会 话 ID。 会 话 ID 这 一 概念 
是 由 SVR4 引 入 的 。 历 史上 ， 基 于 BSD 的 系统 并 不 支持 这 个 概念 ， 但 后 
KEG Te HF T EWID 。getsid 函 数 返 回 会 话 首 进程 的 进程 组 ID 。 

一 些 实现 (如 Solaris) Single UNIX Specification 保 持 一 致 ， 在 实 
践 中 避免 使 用 “会 话 ID” 这 一 短语 ， 而 是 将 此 称 为 “会 话 首 进程 的 进程 组 
ID”。 会 话 首 进程 总 是 一 个 进程 组 的 组 长 进程 ， 所 以 两 者 是 等 价 的 。 


#include <unistd.h> 


pid_t getsid(pid_t pid); 
REME: 大 成功， 返回 会 话 首 进 程 的 进程 组 ID; 者 出错， 返回 -1 
如 若 pid 是 0，getsid 返 回调 用 进程 的 会 话 首 进 程 的 进程 组 ID。 出 于 
安全 方面 的 考虑 ， 一 些 实现 有 如 下 限制 : 如 者 pid 并 不 属于 调用 者 所 在 
的 会 话 ， 那 么 调用 进程 承 不 能 得 到 该 会 话 首 进程 的 进程 组 ID 。 


9.6 ZA 


会 话 和 进程 组 还 有 一 些 其 他 特性 。 
“一 个 会 话 可 以 有 一 个 控制 终端 (controlling terminal) 。 这 通常 是 
Xm lx mr (在 终端 登录 情况 下 ) 或 伪 终 端 设备 (在 网 络 登 录 情 i 


4: 


“建立 与 控制 终端 连接 的 会 话 首 进程 被 称 为 控制 进程 (controlling 


process) 


“一 个 会 话 中 的 几 个 进程 组 可 被 分 成 一 个 前 台 进 程 组 (foreground 
process group) 以 及 一 个 或 多 个 后 台 进 程 组 (background process 


group) ° 
“如 采 一 个 会 话 有 一 个 控制 终端 ， 则 它 有 一 个 前 台 进 程 组 ， 其 他 进 
程 组 为 后 台 进 程 组 。 


“无 论 何 时 键入 终端 的 中 断 键 (常常 是 Delete 或 Ctrl+C) ， 都 会 将 中 
断 信 号 发 送 至 前 台 进 程 组 的 所 有 进程 。 

“无论 何 时 键入 终端 的 退出 键 ( 常 第 是 Ctrlt\) ， 都 会 将 退出 信号 
发 送 至 前 台 进 程 组 的 所 有 进程 。 

“如果 终 端 接口 检测 到 调制 解 调 器 (或 网 络 ) 已 经 断 开 连接 ， 则 将 
挂 断 信号 发 送 至 控制 进程 (会话 首 进程 ，。 

这 些 特性 示 于 图 9-7 中 。 


会 话 

E e E r 71 r 7] 
| | | | 

| | 登录 shell | | procl | | proc2 | | proc3 | | proc4 | 
J i 

后 人 台 进 程 组 后 台 进 程 组 
会 话 首 进 程 = 控制 进程 
ER a 
A 前 台 进 程 组 


图 9-7 进程 组 、 会 话 和 控制 终端 


通 芝 ， 我 们 不 必 担 心 控制 终端 ， 登 妙 时， 将 目 动 建立 控制 终端 。 


POSIX.1 将 如 何 分 配 一 个 控制 终端 的 机 制 交 给 具体 实现 来 选择 。 
19.4 下 中 将 说 明 实际 步骤 。 

当 会 话 首 进程 打开 第 一 个 尚未 与 一 个 会 话 相 关联 的 终端 设备 时 ， 
只 要 在 调用 open 时 没有 指定 O_NOCTTY 标 志 ( 见 3.3 节 ) , System V 
派生 的 系统 将 此 作为 控制 终端 分 配给 此 会 话 。 

当 会 话 首 进程 用 TIOCSCTTY 作 为 request 参 数 (第 三 个 参数 是 空 指 
针 ) 调用 ioctl 时 ， 基 于 BSD 的 系统 为 会 话 分 配 控制 终端 。 为 使 此 调用 成 
功 执 行 ， 此 会 话 不 能 已 经 有 一 个 控制 终端 (通常 ioctl 调 用 紧 跟 在 setsid 
调用 之 后 ，setsid 保 证 此 进程 是 一 个 没有 控制 终端 的 会 话 首 进程 ) 。 除 
了 以 兼容 模式 文 持 其 他 系统 以 外 ， 基 于 BSD 的 系统 不 使 用 POSIX.1 中 对 
open 图 数 所 说 明 的 O_NOCTTY 标 志 。 

图 9-8 总 结 了 本 书 讨论 的 4 个 平台 分 配 控制 终端 的 方式 。 注 意 ， 虽 然 
Mac OS X 10.6.8 是 从 BSD 派 生出 来 的 ， 但 其 分 配 控制 终端 的 方式 如 同 
System V ° 


没有 指定 O_NOCTTY 的 open 
TIOCSCTTY ioctl 命令 


图 9-8 不 同 的 实现 分 配 控 制 终端 的 方式 

有 时 不 管 标准 输入 、 标 准 输出 是 否 重 定向 ， 程 序 都 要 与 控制 终端 
交互 作用 。 保 证 程序 能 与 控制 终端 对 话 的 方法 是 open 文件 /dev/tty。 在 
内 核 中 ， 此 特殊 文件 是 控制 终端 的 同 义 语 。 自 然 地 ， 如 果 程 序 没 有 控 
制 终 端 ， 则 对 于 此 设备 的 open 将 失败 。 

典型 的 例子 是 用 于 读 口 令 的 getpass(3) 函 数 (终端 回 显 被 关闭 ) 。 
这 一 函数 由 crypt(1) 程 序 调 用 ， 并 可 用 于 管道 中 。 例 如 : 


crypt < salaries | lpr 


将 文件 salaries 解密 ， 然 后 经 由 管道 将 输出 送 至 打印 缓冲 服务 程 
序 。 因 为 crypt 从 其 标准 输入 读 输 入 文件 ， 所 以 标准 输入 不 能 用 于 输入 
口令 。 而 且 ，crypt 经 过 了 设计 ， 因 此 每 次 运行 此 程序 时 都 应 输入 加 密 

口令 ， 这 样 也 就 阻止 了 用 户 将 口令 存放 在 文件 中 (这 会 造成 安全 性 漏 
洞 ) 

已 经 知道 有 一 些 方法 可 以 破译 crypt 程序 使 用 的 密码 。 关 于 加 密 文 

件 的 详细 情况 请 参见 Garfinkel 等 [2003]。 


9.7 图 数 tcgetpgrp、tcsetpgrp 和 和 tcgetsid 


需要 有 一 种 方法 来 通知 内 核 哪 一 个 进程 组 是 前 台 进 程 组 ， 这 样 ， 
端 设备 张 动 程序 就 能 知道 将 终端 输入 和 终端 产生 的 信号 发 送 到 何 处 
( 见 图 9-7) 
#include <unistd.h> 
pid t tcgetpgrp(int fd); 
int tcsetpgrp(int fd, pid t pgrpid); 
返回 值 : ARD, RER EHHID; 者 出 错 ， 返 回 -1 
返回 值 : TAD), welo; AES, e- 
函数 tcgetpgrp 返 回 前 台 进 程 组 ID， 它 与 在 fd 上 打开 的 终端 相关 联 。 
如 果 进 程 有 一 个 控制 终端 ， 则 该 进程 可 以 调用 tcsetpgrp 将 前 人 台 进 程 
组 ID 设 置 为 pgrpid。pgrpid 值 应 当 是 在 同一 会 话 中 的 一 个 进程 组 的 ID。 
fd 必须 引用 该 会 话 的 控制 终端 
大 多 数 应 用 程序 并 不 直接 调用 这 两 个 函数 。 它 们 通常 由 作业 控制 
pes 
给 出 控制 TTY 的 文件 描述 符 ， 通 过 tcgetsid 函 数 ， 应 用 程序 就 能 获 
得 会 话 首 进程 的 进程 组 ID 。 


#include <termios.h> 

pid_t tcgetsid(int fd); 

返回 值 ， 奎 成功， 返回 会 话 首 进程 的 进程 组 ID; GERA, e- 

需要 管理 控制 终端 的 应 用 程序 可 以 调用 tcgetsid 函数 识别 出 控制 终 
端的 会 话 首 进程 的 会 话 ID ( 它 等 价 于 会 话 首 进程 的 进程 组 ID) 。 


9.8 作业 控制 


作业 控制 是 BSD 在 1980 年 左右 增加 的 一 个 特性 。 它 允许 在 一 个 终 
端 上 启动 多 个 作业 (进程 组 )， 它 控制 哪 一 个 作业 可 以 访问 该 终端 以 
及 哪些 作业 在 后 台 运 行 。 作 业 控 制 要 求 以 下 3 种 形式 的 支持 。 

(1) 支持 作业 控制 的 shell 。 

(2) 内 核 中 的 终端 驱动 程序 必须 支持 作业 控制 。 

(3) 内 核 必 须 提供 对 某 些 作业 控制 信号 的 支持 。 

SVR3 提 供 了 一 种 不 同 的 作业 控制 ， 称 为 shell 层 (shelllayer) 。 但 
是 POSIX.1 选 择 了 BSD 形 式 的 作业 控制 ， 这 也 是 我 们 在 这 里 所 说 明 的 。 
POSIX.1 的 早期 版 本 中 ， 对 作业 控制 的 支持 是 可 选择 的 ， 现 在 则 要 求 
所 有 平台 都 支持 它 。 

从 shell 使 用 作业 控制 功能 的 角度 观察 ， 用 户 可 以 在 前 台 或 后 台 启 
动 一 个 作业 。 一 个 作业 只 是 儿 个 进程 的 集合 ， 通 常 是 一 个 进程 管道 。 


例如 : 
vi main.c 
在 前 台 局 动 了 只 有 一 个 进程 组 成 的 作业 。 下 面 的 命令 : 
pr *.c | lpr & 


make all & 


在 后 人 台 局 动 了 两 个 作业 。 这 两 个 后 台 作 业 调 用 的 所 有 进程 都 在 后 
台 运 行 。 

如 前 所 述 ， 我 们 需要 一 个 支持 作业 控制 的 shell 以 使 用 由 作业 控制 
提供 的 功能 。 对 于 早期 的 系统 ，shell 是 否 文 持 作业 控制 比较 易于 说 
HH o C shell 支 持 作 业 控 制 ，Bourne shell 不 支持 ， 而 Korn shell 能 否 文 持 
作业 控制 取决 于 主机 是 否 文 持 作业 控制 。 但 是 现在 C shell 已 被 移 植 到 并 
不 支持 作业 控制 的 系统 上 (如 System V 的 早期 版 本 ) ， 而 当 用 名 字 jsh 
而 不 是 用 sh 调用 SVR4 中 的 Bourne shell 时 ， 它 支持 作业 控制 。 如 果 主 机 
文 持 作业 控制 ， 则 Korn shell 继 续 文 持 作 业 控 制 。Bourne-again shellt5 xz 
持 作 业 控 制 。 各 种 shell 之 间 的 差别 无 天 紧要 时 ， 我 们 将 只 是 一 般 地 说 
明 支 持 作业 控制 的 shell 和 不 支持 作业 控制 的 shell 。 

当局 动 一 个 后 台 作 业 时 ，shel 赋 予 它 一 个 作业 标识 符 ， 并 打印 一 
个 或 多 个 进程 ID。 下 面 的 脚本 显示 了 Korn shell 是 如 何 处 理 这 一 点 的 。 


$ make all > Make.out & 

[1] 1475 

[2] 1490 

$ pr *.c | lpr & 

$ 88 A [n] = 

[2] * Done pr *.c | lpr & 

[1] + Done make all > Make.out & 


make 是 作业 编号 1， 所 启动 的 进程 ID 是 1475。 下 一 个 管道 是 作业 编 
号 2， 其 第 一 个 进程 的 进程 ID 是 1490。 当 作业 完成 而 且 键 入 回 车 时 ， 
shell 通 知 作 业已 经 完成 。 键 入 回 千 是 为 了 让 shell 打 印 其 提示 符 。shell 并 
不 在 任意 时 刻 打 印 后 台 作 业 的 状态 改变 一 一 它 只 在 打印 其 提示 符 让 用 
户 输入 新 的 命令 行 之 前 才 这 样 做 。 如 采 不 这 样 处 理 ， 则 当 我 们 正 输入 
一 行 时 ， 它 也 可 能 输出 ， 于 是 ， 束 会 引起 混乱 。 


我 们 可 以 键入 一 个 影响 前 台 作 业 的 特殊 字符 一 一 挂 起 键 (通常 采 
用 Cul-Z) ， 与 终端 驱动 程序 进行 交互 作用 。 键 入 此 字符 使 终端 驱动 
程序 将 信号 SIGTSTP 发 送 至 前 台 进 程 组 中 的 所 有 进程 ， 后 台 进 程 组 作 
业 则 不 受 影响 。 实 际 上 有 3 个 特殊 字符 可 使 终端 驱动 程序 产生 信和 号， 并 
将 它们 发 送 至 前 台 进 程 组 ， 它 们 是 : 

.中断 字 符 (一 般 采 用 Delete 或 Ctrl+C) 产生 SIGINT; 

"退出 字符 〈 一 般 采 用 Ctrl+\) 产生 SIGQUIT; 

。 挂 起 字符 (一般 采 用 Ctrl+Z) 产生 SIGTSTP ° 

第 18 章 中 将 说 明 可 将 这 3 个 字符 更 改 为 用 户 选 择 的 任意 其 他 字 
符 ， 以 及 如 何 使 终端 驱动 程序 不 处 理 这 些 特殊 字符 。 

终端 驱动 程序 必须 处 理 与 作业 控制 有 关 的 另 一 种 情况 。 我 们 可 以 
有 一 个 前 台 作 业 ， 若 干 个 后 台 作 业 ， 这 些 作业 中 哪 一 个 接收 我 们 在 终 
端 上 键入 的 字符 呢 ? 只 有 前 台 作 业 接 收 终端 输入 。 如 果 后 台 作 业 试 图 
读 终 端 ， 这 并 不 是 一 个 错误 ， 但 是 终端 驱动 程序 将 检测 这 种 情况 ， 并 
且 向 后 台 作 业 发 送 一 个 特定 信号 SIGTTIN。 该 信号 通常 会 停止 此 后 台 
作业 ， 而 shell 则 向 有 关 用 户 发 出 这 种 情况 的 通知 ， 然 后 用 户 就 可 用 shell 
命令 将 此 作业 转 为 前 台 作 业 运 行 ， 于 是 它 就 可 读 终端 。 下列 操 作 过 程 
显示 了 这 一 点 : 


$ cat > temp.foo & 在 后 台 启 动 ， 但 将 从 标准 输入 读 

[1] 1681 

$ 键入 回 车 

[1] + Stopped (SIGTTIN) cat > temp.foo & 

$ fg 961 使 1 号 作业 成 为 前 合作 业 

cat > temp.foo shell 告诉 我 们 现在 哪 一 个 作业 在 
前 台 

hello, world 输入 一 行 


^D 键入 文件 结束 符 


$ cat temp.foo 检查 该 行 已 送 入 文件 

hello, world 

注意 ， 这 个 例子 在 Mac OS X 10.6.8 上 不 起 作用 。 在 试图 把 cat 命 令 
放 到 前 台 时 ，read 返 回 失 败 ， 并 将 ermo 设 为 EINTR。Mac OS X 是 基于 
FreeBSD 的 ， 在 FreeBSD 下 本 例 运 行 民 好 ， 因 此 这 应 该 是 Mac OS X 的 一 
^" bug ° 

shell 在 后 台 启 动 cat 进 程 ， 但 是 当 cat 试 图 读 其 标准 输入 (控制 终 
mS) 上 时， 终端 驱 动 程序 知道 它 是 个 后 台 人 作业， 于 是 将 SIGTTIN 信 和 号 送 
至 该 后 台 作 业 。shell 检 测 到 其 子 进程 的 状态 改变 (回忆 8.6 节 中 对 wait 
和 waitpid 函数 的 讨论 ) ， 并 通知 我 们 该 作业 已 被 停止 。 人 然后， 我 们 用 
shell 的 fg 命令 将 此 停止 的 作业 送 入 前 台 运 行 (关于 作业 控制 命令 ， 如 fg 
和 bg 的 详细 情况 ， 以 及 标识 不 同 作 业 的 各 种 方法 请 参阅 有 天 shell 的 手 
册页 ) 。 这 样 做 使 shell 将 此 作业 转 为 前 台 进 程 组 (tcsetpgrp) ， 并 将 继 
续 信 号 (SIGCONT) 送 给 该 进程 组 。 因 为 该 作业 现在 前 台 进 程 组 中 ， 
所 以 它 可 以 读 控制 终端 。 

如 有 果 后 台 作 业 输 出 到 控制 终端 又 将 发 生 什 么 呢 ? 这 是 一 个 我 们 可 
以 允许 或 禁止 的 选项 。 通 常 ， 可 以 用 stty(1) 命 令 改变 这 一 选项 (第 18 章 
将 说 明 在 程序 中 如 何 改变 这 一 选项 ) 。 下 面 显示 了 这 种 操作 过 程 : 


$ cat temp.foo & 在 后 台 执 行 

[1] 1719 

$ hello, world 是 示 符 后 出 现 后 台 作 业 的 输出 键入 回 车 
[1] + Done cat temp.foo & 

$ stty tostop 禁止 后 人 台 作 业 和 输出 至 控制 终端 

$ cat temp.foo & 在 后 台 再 试 一 次 

[1] 1721 

$ 键入 回 车 ， 发 现 作业 已 停止 


[1] + Stopped(SIGTTOU) cat temp.foo & 


$ fg 961 在 前 台 恢 复 停止 的 作业 


cat temp.foo shell 告 诉 我 们 现在 哪 一 个 作业 在 前 人 台 
hello, world 这 是 该 作业 的 输出 


在 用 户 禁 止 后 台 作 业 回 控制 终端 写 时 ， 该 作业 的 cat 命 令 试图 写 其 
标准 输出 ， 此 时 ， 终 端 驱 动 程序 识别 出 该 写 操 作 来 自 于 后 人 台 进 程 ， 于 
是 向 该 作业 发 送 SIGTTOU 信 和 号 ，cat 进 程 阻 塞 。 与 上 面 的 例子 一 样 ， 当 
用 户 使 用 shell 的 fg 命令 将 该 作业 转 为 前 台 时 ， 该 作业 继续 执行 直至 完 
成 。 

图 9-9 总 结 了 前 面 已 说 明 的 作业 控制 的 某 些 功能 。 罕 过 终端 驱动 程 
序 框 的 实 线 表明 终端 VO 301 和 终端 产生 的 信号 总 是 从 前 台 进 程 组 连接 
到 实际 终端 。 对 应 于 SIGTTOU 信和 号 的 虚线 表明 后 台 进 程 组 进程 的 输出 
是 否 出 现在 终端 是 可 选择 的 。 


init.inetd ik launchd 


getty 或 
telnetd 


在 setsid 后 , exec 


建立 控制 终端 


前 全 进程 组 


图 9-9 对 于 前 台 、 后 台 作 业 以 及 终端 驱动 程序 的 作业 控制 功能 总 结 

是 否 需 要 作业 控制 是 一 个 有 争议 的 问题 。 作 业 控 制 是 在 窗口 终端 
广泛 得 到 应 用 之 前 设计 和 实现 的 。 很 多 人 认为 设计 得 好 的 窗口 系统 
经 免除 了 对 作业 控制 的 需要 。 某 些 人 抱怨 作业 控制 的 实现 要 求 得 到 内 
核 、 终 端 驱 动 程序 、shell 以 及 某 些 应 用 程序 的 文 择 ， 和 是 吃力 不 讨好 的 


事情 。 某 些 人 在 窗口 系统 中 使 用 作业 控制 ， 他 们 认为 两 者 都 需要 。 不 
管 你 的 意见 如 何 ， 作 业 控 制 都 是 POSIX.1 要 求 的 部 分 。 


9.9 shell 执 行程 


让 我 们 检验 一 下 shell 是 如 何 执行 程序 的 ， 以 及 这 与 进程 组 、 控 制 
终端 和 会 话 等 概念 的 关系 。 为 此 ， 再 次 使 用 ps 命令 。 

首先 使 用 不 支持 作业 控制 的 、 在 Solaris 上 运行 的 经 典 Bourne shell ° 
如 果 执 行 : 

ps -0 pid,ppid,pgid,sid,comm 

则 其 输出 可 能 是 : 

PID PPID PGID SID COMMAND 
949 947 949 949 sh 

1774 949 949 949 ps 

ps 的 父 进程 是 shell， 这 正 是 我 们 所 期 望 的 。shell 和 ps 命令 两 者 位 于 
同一 会 话 和 前 台 进 程 组 (949) 中 。 因 为 我 们 是 用 一 个 不 支持 作业 控制 
的 shell 执 行 命令 时 得 到 该 值 的 ， 所 以 称 其 为 前 台 进 程 组 。 

某 些 平台 支持 一 个 选项 ， 它 使 ps(1) 命 令 打 印 与 会 话 控制 终端 相关 
联 的 进程 组 ID。 该 值 在 TPGID 列 中 显示 。 壮 憾 的 是 ，ps(1) 命 令 的 输出 
在 各 个 UNIX 版 本 中 都 有 所 不 同 。 例 如 ，Solaris 10 不 文 持 该 选项 。 在 
FreeBSD 8.0、Linux 3.2.0 和 Mac OS X 10.6.8 中 ， 命 令 

ps -0 pid, ppid, pgid, sid, tpgid, comm 

准确 地 打印 我 们 想 要 的 信息 。 

注意 ， 将 进程 与 终端 进程 组 ID (TPGID 列 ) 关联 起 来 有 点 用 词 不 
当 。 进 程 并 没有 终端 进程 控制 组 。 进 程 属于 一 个 进程 组 ， 而 进程 组 属 
于 一 个 会 话 。 会 话 可 能 有 也 可 能 没有 控制 终端 。 如 采 它 确实 有 一 个 挖 


制 终端 ， 则 此 终端 设备 知道 其 前 台 进 程 的 进程 组 ID。 这 一 值 可 以 用 
tcsetpgrp 加 数 在 终端 驱动 程序 中 设置 ( 见 图 9-9) 。 前 台 进 程 组 ID 是 终 
端的 一 个 属性 ， 而 不 是 进程 的 属性 。 取 目 终端 设备 驱动 程序 的 该 值 是 
ps 在 TPGID 列 中 打印 的 值 。 如 果 ps 发 现 此 会 话 没有 控制 终端 ， 则 它 在 该 
列 打印 0 或 者 -1， 具 体 值 因 不 同 平台 而 异 。 
如 果 在 后 台 执 行 命令 : 
ps -0 pid,ppid,pgid,sid,comm & 
则 唯一 改变 的 值 是 命令 的 进程 ID: 
PID PPID PGID SID COMMAND 
949 947 949 949 sh 
1812 949 949 949 ps 
因为 这 种 shell 不 知道 作业 控制 ， 所 以 没有 将 后 台 作 业 放 入 目 己 的 
进程 组 ， 也 没有 从 后 台 作 业 处 取 走 控制 终端 。 
现在 看 一 看 Bourne shell 如 何 处 理 管道 。 执 行 下 列 命令 : 
ps -o pid,ppid,pgid,sid,comm | cat1 
其 输出 是 : 
PID PPID PGID SID COMMAND 
949 947 949 949 sh 
1823 949 949 949 cat1 
1824 1823 949 949 ps 
(程序 cat1 是 标准 cat 程 序 的 一 个 副本 ， 只 是 名 字 不 同 。 本 节 还 将 使 
用 cat 的 男 一 个 名 为 cat2 的 副本 。 在 一 个 管道 中 使 用 两 个 cat 副 本 时 ， 不 
同 的 名 字 可 使 我 们 将 它们 区 分 开 来 。) 注意 ， 管 道中 的 最 后 一 个 进程 
是 shell 的 子 进 程 ， 该 管道 中 的 第 一 个 进程 则 是 最 后 一 个 进程 的 子 进 
程 。 从 中 可 以 看 出 ，shell fork 一 个 它 目 身 的 副本 ， 然 后 此 副本 再 为 管道 
中 的 每 条 命令 各 fork 一 个 进程 。 
如 果 在 后 台 执 行 此 管道 : 


ps -o pid,ppid,pgid,sid,comm | cat1 & 

则 只 改变 进程 ID。 因 为 shell 并 不 处 理 作业 控制 ， 后 台 进 程 的 进程 
组 ID 仍 是 949， 如 同 会 话 的 进程 组 ID 一 样 。 

如 采 一 个 后 全 进程 试图 读 其 控制 终端 ， 则 会 发 生 什 么 呢 ? 例如 ， 
AMT: 

cat > temp.foo & 

在 有 作业 控制 时 ， 后 台 作 业 被 放 在 后 从 进程 组 ， 如 果 后 全 作业 试 
图 读 控制 终端 ， 则 会 产生 信号 SIGTTIN。 在 没有 作业 控制 时 ， 其 处 理 
方法 是 : 如 果 该 进程 目 己 没有 重 定 同 标 准 输入 ， 则 shell 目 动 将 后 合 进 
程 的 标准 输入 重 定向 到 /dev/null。 读 /dev/null 则 产生 一 个 文件 结束 。 这 
就 意味 着 后 台 catj 井 程 立即 读 到 文件 尾 ， 并 正常 终止 。 

前 面 说 明了 对 后 台 进 程 通过 其 标准 输入 访问 控制 终端 的 适当 的 处 
理 方法 但是， 如果 一 个 后 台 进 程 打 开 /dev/tty 并 且 读 该 控制 终端 ， 叉 
将 怎样 呢 ? 对 此 问题 的 回答 是 “看 情况 ”。 但 是 这 很 可 能 不 是 我 们 所 期 
望 的 。 例 如 : 

crypt salaries | lpr & 

就 是 这 样 的 一 条 管道 。 我 们 在 后 台 运 行 它 ， 但 是 crypt 程序 打 
开 /dev/tty， 更 改 终端 的 特性 (禁止 回 显 ) ， 然 后 从 该 设备 读 ， 最 后 重 
置 该 终端 特性 。 当 执行 这 条 后 台 管 道 时 ，crypt 在 终端 上 打印 提示 符 
“Password: ”， 但 是 shell 读 取 了 我 们 所 输入 的 加 密 口 令 ， 并 试图 执行 以 
加 密 口 令 为 名 称 的 命令 。 我 们 输送 给 shell 的 下 一 行 则 被 crypt 进 程 取 为 
口令 行 ， 于 是 salaries 也 就 不 能 正确 地 被 译 码 ， 结 果 将 一 堆 无 用 的 信息 
送 到 了 打印 机 。 在 这 里 ， 我 们 有 了 两 个 进程 ， 它 们 试图 同时 读 同一 设 
备 ， 其 结果 则 依赖 于 系统 。 前 面 说 明 的 作业 控制 以 较 好 的 方式 处 理 一 
个 终端 在 多 个 进程 间 的 转 授 。 

返回 到 Bourne shell 实 例 ， 在 一 条 管道 中 执行 3 个 进程 ， 我 们 可 以 检 
J5 Bourne shell 使 用 的 进程 控制 方式 : 


ps -o pid,ppid,pgid,sid,comm | cat1 | cat2 

其 输出 为 : 

PID PPID PGID SID COMMAND 
949 947 949 949 sh 

1988 949 949 949 cat2 

1989 1988 949 949 ps 

1990 1988 949 949 cat1 

如 果 在 你 的 系统 上 ， 输 出 的 命令 名 不 正确 ， 那 也 不 必 为 此 感到 惊 
懂 。 有 了 时 可 能 会 得 到 类 似 如 下 的 输出 : 

PID PPID PGID SID COMMAND 
949 947 949 949 sh 

1831 949 949 949 sh 

1832 1831 949 949 ps 

1833 1831 949 949 sh 

造成 此 种 结果 的 原因 是 ，ps 进 程 与 shell 产 生 竞争 条 件 ，shell 创 建 一 
个 子 进程 并 由 它 执行 cat 命 令 。 在 这 种 情况 下 ， 当 ps 已 经 获得 进程 列表 
并 打印 时 ，shell 尚 未 完成 exec 调 用 。 

再 重申 一 过 ， 该 管道 中 的 最 后 一 个 进程 是 shell 的 子 进程 ， 而 执行 
管道 中 其 他 命令 的 进程 则 是 该 最 后 进程 的 子 进 程 。 图 9-10 显示 了 所 发 
生 的 情况 。 因 为 该 绾 道 线 中 的 最 后 一 个 进程 是 登录 shell 的 于 进程 ， 当 
该 进程 (cat2) 终止 时 ，shell 得 到 通知 。 


图 9-10 Bourne shell 执 行 管道 ps | cat1 | cat2 时 的 进程 
现在 让 我 们 用 一 个 运行 在 Linux 上 的 作业 控制 shell 来 检验 同一 个 
例子 。 这 将 显示 这 些 shell 处 理 后 台 作 业 的 方法 。 在 本 例 中 将 使 用 
Bourne-again shell， 用 其 他 作业 控制 shell 得 到 的 结果 几乎 是 一 样 的 。 
ps -0 pid,ppid,pgid,sid,tpgid,comm 
其 输出 为 : 
PID PPID PGID SID TPGID COMMAND 
2037 2818 2837 2837 5796 bash 
5796 2837 5796 2837 5796 ps 
(从 本 例 开 始 ， 以 粗 体 显 示 前 台 进 程 组 。) 我 们 立即 看 到 了 与 
Bourne shell 例 子 的 区 别 。Bourne-again shell 将 前 台 作 业 (ps) 放 入 了 它 
自己 的 进程 组 (5796) 。ps 命 令 是 进程 组 组 长 进程 ， 也 是 该 进程 组 的 
唯一 进程 。 进 一 步 而 言 ， 此 进程 组 具有 控制 终端 ， 所 以 它 是 前 台 进 程 
组 。 我 们 的 登录 shell 在 执行 ps 命令 时 是 后 台 进 程 组 。 但 需要 注意 的 


征 ， 这 两 个 进程 组 2837 和 5796 都 是 同一 会 话 的 成 员 。 事 实 上 ， 在 本 入 
的 各 实例 中 ， 会 话 决 不 会 改变 。 
在 后 台 执行 此 进程 : 
ps -0 pid,ppid,pgid,sid,tpgid,comm & 
其 输出 为 : 
PID PPID PGID SID TPGID COMMAND 
2837 2818 2837 2837 2837 bash 
5797 2837 5797 2837 2837 ps 
再 一 次 ，ps 命 令 被 放 入 它 自 己 的 进程 组 ， 但 是 此 时 进程 组 
(5797) 不 再 是 前 台 进 程 组 ， 而 是 一 个 后 台 进 程 组 。TPGID 2837 指 示 
前 台 进 程 组 是 登录 shell 。 
按 下 列 方式 在 一 个 管道 中 执行 两 个 进程 : 
ps -o pid,ppid,pgid,sid,tpgid,comm | cat1 
其 输出 为 : 
PID PPID PGID SID TPGID COMMAND 
2837 2818 2837 2837 5799 bash 
5799 2837 5799 2837 5799 ps 
5800 2837 5799 2837 5799 cat1 
两 个 进程 ps 和 cat1 都 在 一 个 新 进程 组 (5799) 中 ， 这 是 一 个 前 台 进 
程 组 。 在 本 例 和 类 似 的 Bourne shell 实例 之 间 能 看 到 另 一 个 区 别 。 
Bourne shell 首先 创建 将 执行 管道 中 最 后 一 条 命令 的 进程 ， 而 此 进程 是 
第 一 个 进程 的 父 进程 。 在 这 里 ，Bourne-again shel 是 两 个 进程 的 父 进 
程 。 但 是 ， 如 果 在 后 台 执 行 此 管道 : 
ps -0 pid,ppid,pgid,sid,tpgid,comm | cat1 & 
其 结果 是 类 似 的 ， 但 是 ps 和 cat1 现 在 都 处 于 同一 后 台 进 程 组 。 
PID PPID PGID SID TPGID COMMAND 
2837 2818 2837 2837 2837 bash 


5801 2837 5801 2837 2837 ps 
5802 2837 5801 2837 2837 cat1 
注意 ， 使 用 的 shell 不 同 ， 创 建 各 个 进程 的 顺序 也 可 能 不 同 。 


9.10 孤儿 进程 组 


我 们 曾 提 及 ， 一 个 其 父 进程 已 终止 的 进程 称 为 孤儿 进程 (orphan 
process) ， 这 种 进程 由 init 进 程 “< 收养”。 现 在 我 们 要 说 明 整 个 进程 组 也 
可 成 为 “孤儿 ”， 以 及 POSIX.1 如 何 处 理 它 。 

实例 

考虑 一 个 进程 ， 它 fork 了 一 个 子 进 程 然 后 终止 。 这 在 系统 中 是 经 常 
发 生 的 ， 并 无 异常 之 处 ， 但 是 在 父 进程 终止 时 ， 如 果 该 子 进程 停止 
(用 作业 控制 ) 又 将 如 何 呢 ? 子 进 程 如 何 继续 ， 以 及 子 进 程 是 否 知道 
它 已 经 是 孤儿 进程 ? 图 9-11 显 示 了 这 种 情形 : 父 进 程 已 经 fork 了 子 进 
程 ， 该 子 进程 停止 ， 父 进程 则 将 退出 。 

构成 此 种 情形 的 程序 示 于 图 9-12 中 。 下 面 要 说 明 该 程序 的 某 些 新 特 
性 。 这 里 ， 假 定 使 用 了 一 个 作业 控制 shell。 回 忆 前 面 所 述 ，shell 将 前 
台 进 程 放 在 它 〈 指 前 台 进 程 ) 自己 的 进程 组 中 (本 例 中 是 6099) , 
shell 则 留 在 自己 的 进程 组 内 (2837) 。 子 进程 继承 其 父 进程 (6099) 
的 进程 组 。 在 fork 之 后 : 


| 进程 组 2837 


会 话 父 进程 
| (PID 6099) 


| 进程 组 6099 
图 9-11 将 要 成 为 孤儿 的 进程 组 实例 

。 父 进程 睡眠 5 秒 ， 这 是 一 种 让 子 进 程 在 父 进程 终止 之 前 运行 的 一 种 
权宜 之 计 。 

FEM ATER (AS (SIGHUP) 建立 信号 处 理 程序 。 这 样 就 能 观 
察 到 SIGHUP 信 号 是 否 已 发 送 给 子 进程 。 (第 10 章 将 讨论 信号 处 理 程 
序 。) 

* 子 进程 用 k 记 函数 向 其 自身 发 送 停止 信号 (SIGTSTP) 。 这 将 停止 
子 进程 ， 类 似 于 用 终端 挂 起 字符 (Ctrl+Z) 停止 一 个 前 台 作业 。 

“ 当 父 进程 终止 时 ， 该 子 进程 成 为 孤儿 进程 ， 所 以 其 父 进程 ID 成 为 
1， 也 就 是 init 进 程 ID 。 

“现在 ， 子 进程 成 为 一 个 孤儿 进程 组 的 成 员 。POSIX.1 将 孤儿 进程 
组 (orphaned process group) 定义 为 : 该 组 中 每 个 成 员 的 父 进程 要 么 是 


该 组 的 一 个 成 员 ， 要 么 不 是 该 组 所 属 会 话 的 成 员 。 对 孤儿 进程 组 的 另 
一 种 描述 可 以 是 : 一 个 进程 组 不 是 孤儿 进程 组 的 条 件 是 一 一 该 组 中 有 
一 个 进程 ， 其 父 进程 在 属于 同一 会 话 的 另 一 个 组 中 。 如 果 进 程 组 不 是 
孤儿 进程 组 ， 那 么 在 属于 同一 会 话 的 另 一 个 组 中 的 父 进程 就 有 机 会 重 
新 启动 该 组 中 停止 的 进程 。 在 这 里 ， 进 程 组 中 每 一 个 进程 的 父 进程 
〈 例 如， 进程 6100 的 父 进程 是 进程 1) 都 属于 另 一 个 会 话 。 所 以 此 进程 
组 是 孤儿 进程 组 。 

“因为 在 父 进程 终止 后 ， 进 程 组 包含 一 个 停止 的 进程 ， 进 程 组 成 为 
孤儿 进程 组 ，POSIX.1 要 求 向 新 孤儿 进程 组 中 处 于 停止 状态 的 每 一 个 进 
程 发 送 挂 断 信 号 (SIGHUP) ， 接 着 又 向 其 发 送 继续 信 号 
(SIGCONT) 。 

“在 处 理 了 挂 断 信 号 后 ， 子 进程 继续 。 对 挂 断 信 号 的 系统 默认 动作 
是 终止 该 进程 ， 为 此 必须 提供 一 个 信号 处 理 程序 以 捕捉 该 信号 。 因 
此 ， 我 们 期 望 sig_ hup EN ZX FAY printf 2: TE pr. ids 函 数 中 的 printf 之 前 执 
行 。 


#include "apue.h" 
#include «errno.h» 


static void 
sig hup(int signo) 
( 
printf("SIGHUP received, pid = %ld\n", (long)getpid()); 
) 


static void 
pr ids(char *name) 
( 
printf("$s: pid = %ld, ppid = %ld, pgrp = %ld, tpgrp = %ld\n", 
name, (long) getpid(), (long) getppid(), (long) getpgrp(), 
(long) tcgetpgrp (STDIN_FILENO) ); 
fflush (stdout); 


int 
main (void) 


pr_ids ("parent"); 

if ((pid = fork()) < 0) { 
err_sys("fork error"); 

} else if (pid > 0) { /* parent */ 


sleep (5); /* sleep to let child stop itself */ 
} else { JE TERA wy 
pr ids("chiild"); 
Signal(SIGHUP, sig hup); /* establish signal handler */ 
kill(getpid(), SIGTSTP); /* stop ourself */ 
pr ids("child"); /* prints only if we're continued */ 
if (read(STDIN FILENO, &c, 1) !- 1) 


printf("read error $d on controlling TTY\n", errno); 


exit(0); 


图 9-12 创建 一 个 孤儿 进程 组 

下 面 是 图 9-12 中 的 程序 的 输出 : 

$ ./a.out 

parent: pid = 6099, ppid = 2837, pgrp = 6099, tpgrp = 6099 
child: pid = 6100, ppid = 6099, pgrp = 6099, tpgrp = 6099 
$ SIGHUP received, pid = 6100 


child: pid = 6100, ppid = 1, pgrp = 6099, tpgrp = 2837 

read error 5 on controlling T'TY 

注意 ， 因 为 两 个 进程 ， 登 录 shell 和 子 进 程 都 写 问 终端， 所 以 shell 提 
示 符 和 子 进程 的 输出 一 起 出 现 。 正 如 我 们 所 期 望 的 那样 ， 子 进程 的 父 
进程 ID 变 成 1。 

在 子 进 程 中 调用 pr_ ids 后 ， 程 序 企图 读 标 准 输入 。 如 前 所 述 ， 当 后 
台 进 程 组 试图 读 控制 终端 时 ， 对 该 后 合 进程 组 产生 SIGTTIN。 但 在 这 
里 ， 这 是 一 个 孤儿 进程 组 ， 如 果 内 核 用 此 信号 集 止 它 ， 则 此 进程 组 中 
的 进程 殉 再 也 不 会 继续 。POSIX.1 规 定 ，read 返 回 出 错 ， 其 errmno 设 置 为 
EIO (在 本 书 所 用 的 系统 中 其 值 是 5) 。 

最 后 ， 要 注意 的 是 父 进 程 终止 时 ， 子 进程 变 成 后 台 进 程 组 ， 因 为 
父 进程 是 由 shell 作 为 前 台 作 业 执 行 的 。 

在 19.5 节 的 pty 程 序 中 将 会 看 到 孤儿 进程 组 的 另 一 个 例子 。 


9.11 FreeBSD 实 现 


前 面 说 明了 进程 、 进 程 组 、 会 话 和 控制 终端 的 各 种 属性 ， 值 得 观 
察 一 下 所 有 这 些 是 如 何 实现 的 。 下 面 徐 要 说 明 FreeBSD 中 的 实现 。 
SVR4 实 现 的 某 些 详细 情况 则 请 参阅 Williams[1989]。 图 9-13 显 示 了 
FreeBSD 使 用 的 各 种 有 天 数据 结构 。 

下 面 从 session 结 构 开始 说 明 图 中 标 出 的 各 个 字段 。 每 个 会 话 都 分 
配 一 个 session 结 构 (例如 ， 每 次 调用 setsid 时 ) 。 

。s_count 是 该 会 话 中 的 进程 组 数 。 当 此 计数 器 减 至 0 时 ， 则 可 释放 
此 结构 。 

*s_leader 是 指 同 会 话 首 进程 proc 结 构 的 指针 。 

"s_ttyvp 是 指 同 控制 终端 vnode 结 构 的 指针 。 


“s_ttyp 是 指 回 控制 终端 tty 结 构 的 指针 。 

s sidzé  i& ID ° is id E ik ID 1X — HG FF FE Single UNIX 
Specification 的 组 成 部 分 。 

在 调用 setsid 时 ， 在 内 核 中 分 配 一 个 新 的 session 结 构 。s_count 设 置 
为 1，s_leader 设 置 为 调用 进程 proc 结构 的 指针 ，s_sid 设置 为 进程 ID， 
因为 新 会 话 没有 控制 终端 ， 所 以 s_ttyvp 和 s_ttyp 设 置 为 空 指针 。 

接着 说 明 tty 结构 。 每 个 终端 设备 和 每 个 伪 终 端 设 备 均 在 内 核 中 分 
配 这 样 一 种 结构 (第 19 章 将 对 伪 终 端 做 更 多 说 明 ) 。 

*L_session 指 向 将 此 终端 作为 控制 终端 的 session 结 构 (注意 ，tty 结 
构 指 向 Session 结构，session 结 构 也 指向 tty 结 构 ) 。 终 端 在 失去 载波 信和 号 
时 使 用 此 指针 将 挂 起 信号 发 送 给 会 话 首 进程 ( 见 图 9-7) ° 
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图 9-13 会 话 和 进程 组 的 FreeBSD 实 现 


“tpgrmp 指 向 前 台 进 程 组 的 pgrp 结 构 。 终 端 驱 动 程序 用 此 字段 将 信 
号 发 送 给 前 台 进 程 组 。 由 输入 特殊 字符 〈 中 断 、 退 出 和 挂 起 ) 而 产生 
的 3 个 信号 被 发 送 至 前 台 进 程 组 。 

“t_termios 是 包含 所 有 这 些 特殊 字符 和 与 该 终端 有 关 信 息 (如 波 特 
率 、 回 显 打开 或 关闭 等 ) 的 结构 。 第 18 章 将 再 说 明 此 结构 。 

。t_winsize 是 包含 终端 窗口 当前 大 小 的 winsize 型 结构 。 当 终端 窗口 
大 小 改变 上 时， 信号 SIGWINCH 人 被 发送 至 前 台 进 程 组 。18.12 廊 将 说 明 如 
何 设置 和 获取 终端 当前 窗口 大 小 。 


为 了 找到 特定 会 话 的 前 台 进 程 组 ， 内 核 从 session 结 构 开 始 ， 然 后 
用 s_ttyp 得 到 控制 终端 的 tty 结 构 ， 再 用 t_pgrp 得 到 前 台 进 程 组 的 pgrp 结 
构 。 

pgrp 结 构 包 含 一 个 特定 进程 组 的 信息 。 其 中 各 相关 字段 具体 如 下 。 

"pg_id 是 进程 组 ID 。 

。Dg& _ session 指 癌 此 进程 组 所 属 会 话 的 Session 结构 。 

e pg. members 是 指向 此 进程 组 proc 结构 表 的 指针 ， 该 proc 结构 代 
表 进 程 组 的 成 员 。proc 结 构 中 p_pglist 结 构 是 双 癌 链表 ， 指 癌 该 组 中 的 
下 一 个 进程 和 上 一 个 进程 。 直 到 过 到 进程 组 中 的 最 后 一 个 进程 ， 它 的 
proc 结 构 中 p_pglist 结 构 为 空 指针 。 

proc 结 构 包 含 一 个 进程 的 所 有 信息 。 

"p_pid 包 含 进程 ID 。 

*p_pptr 是 指 癌 父 进程 proc 结 构 的 指 秆 。 

。D_pgrp 指 癌 本 进程 所 属 的 进程 组 鸭 pgrp 结 构 的 指针 。 

"p_pglist 是 一 个 结构 ， 其 中 包含 两 个 指针 ， 分 别 指向 进程 组 中 上 一 
“NAN REFS © 

最 后 还 有 一 个 vnode 结 构 。 如 前 所 述 ， 在 打开 控制 终端 设备 时 分 配 
此 结构 。 进 程 对 /devwtty 的 所 有 访问 都 通过 vnode 结 构 。 


9.12 小 结 


本 章 说 明了 进程 组 之 间 的 关系 Ain, ERA Ph te A 
成 。 作 业 控 制 是 当今 很 多 UNIX 系 统 所 支持 的 功能 ， 本 章 说 明了 它 是 如 
何 由 支持 作业 控制 的 shell 实 现 的 。 在 这 些 进 程 天 系 中 也 涉及 了 进程 的 
控制 终端 /dewtty ° 


所 有 这 些 进 程 的 关系 都 使 用 了 很 多 信号 方面 的 功能 。 下 一 章 将 详 
细 讨 论 UNIX 中 的 信号 机 制 。 


习题 


9.1 考虑 6.8 世 中 说 明 的 ump 和 wtmp 文 件 ， 为 什么 logout 记 录 是 由 
init 进 程 写 的 ? 对 于 网 络 登录 的 处 理 与 此 相同 吗 ? 

9.2 编写 一 段 程序 调用 fork 并 使 子 进程 建立 一 个 新 的 会 话 。 和 验证 子 
进程 变 成 了 进程 组 组 长 且 不 再 有 控制 终端 。 
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10.1 引言 


言 号 是 软件 中 断 。 很 多 比较 重要 的 应 用 程序 都 需 处 理 信和 号。 信号 
提供 了 一 种 处 理 异 步 事 件 的 方法 ， 例 如 ， 终端 用 户 键入 中 断 键 ， 会 通 
过 信和 号 机 制 停止 一 个 程序 ， 或 及 早 终止 管道 中 的 下 一 个 程序 。 

UNIX 系 统 的 早期 版 本 就 已 经 提供 信号 机 制 ， 但 是 这 些 系 统 (如 
V7) 所 提供 的 信号 模型 并 不 可 靠 。 信 和 号 可 能 丢失 ， 而 且 在 执行 临界 区 
代码 时 ， 进 程 很 难关 闭 所 选择 的 信号 。4.3BSD 和 SVR3 对 信和 号 模型 都 
做 了 更 改 ， 增 加 了 可 靠 信 号 机 制 。 但 是 Berkeley 和 AT&T 所 做 的 更 改 之 
间 并 不 兼容 。 幸 运 的 是 ，POSIX.1 对 可 靠 信 号 例 程 进行 了 标准 化 ， 这 正 
是 本 章 所 要 说 明 的 。 

本 章 先 对 信和 号 机 制 进 行 综述 ， 并 说 明 每 种 信号 的 一 般 用 法 。 然 后 
分 析 早 期 实现 的 问题 。 在 分 析 存 在 的 问题 之 后 再 说 明 解 决 这 些 问题 的 
方法 ， 这 种 安排 有 助 于 加 深 对 改进 机 制 的 理解 。 本 章 也 包含 了 很 多 并 
非 完 全 正确 的 实例 ， 这 样 做 的 目的 是 为 了 对 其 不 足 之 处 进行 讨论 。 


10.2 信 "A 


首先 ， 每 个 信号 都 有 一 个 名 字 。 这 些 名 字 都 以 3 个 字符 SIG 开 头 。 
例如 ，SIGABRIT 是 天 折 信 号 ， 当 进程 调用 abort 函 数 时 产生 这 种 信和 号。 
SIGALRM 是 闹钟 信号 ， 由 alarm 函 数 设置 的 定时 器 超时 后 将 产生 此 信 
号 。V7 有 15 种 不 同 的 信号 ，SVR4 和 4.4BSD 均 有 31 种 不 同 的 信号 。 
FreeBSD 8.0 支 持 32 种 信号 ，Mac OS X 10.6.8 以 及 Linux 3.2.0 都 支持 31 
种 信号 ， 而 Solaris 10 文 持 40 种 信号 。 但 是 ，FreeBSD、Linux 和 Solaris 
作为 实时 扩展 都 文 持 另外 的 应 用 程序 定义 的 信号 。 虽 然 本 书 不 包括 
POSIX 实 时 扩展 〈《 有 关 信 息 请 参阅 Gallmeister[1995]) ， 但 是 SUSv4 已 
经 把 实时 信号 接口 移 至 基础 规范 说 明 中 。 
在 头 文件 <signal.h> 中 ， 信 号 名 都 被 定义 为 正 整数 常量 〈 信 号 编 


号 ) 

实际 上 ， 实 现 将 各 信号 定义 在 另 一 个 头 文 件 中 ， 但 是 该 头 文 件 又 
包括 在 <signal.h> 中 。 内 核 包 括 对 用 户 级 应 用 程序 有 意义 的 头 文件 ， 这 
被 认 为 是 一 种 不 好 的 形式 ， 所 以 如 车 应 用 程序 和 内 核 两 者 都 需 使 用 同 
一 定义 ， 那 么 就 将 有 天 信息 放置 在 内 核 尖 文件 中 ， 然 后 用 户 级 头 文件 
再 包括 该 内 核 头 文件 。 于 是 ，FreeBSD 8.0 和 Mac OS X 10.6.8 将 信号 定 
X TE <sys/signal.h> F , Linux 3.2.0 将 信号 定义 在 <bits/signum.h> 中 , 
Solaris 10 将 信号 定义 在 <sys/iso/signal iso.h> 中 。 

不 存在 编号 为 0 的 信号 。 在 10.9 方 中 将 会 看 到 ，kill 函数 对 信和 号 编 
号 0 有 特殊 的 应 用 。POSIX.1 将 此 种 信号 编号 值 称 为 空 信号 。 

很 多 条 件 可 以 产生 信号。 

“ 当 用 户 按 某 些 终 端 键 时 ， 引 发 终端 产生 的 信号 。 在 终端 上 按 
Delete 键 (或 者 很 多 系统 中 的 Ctrlt+C 键 ) 通常 产生 中 断 信 号 

(SIGINT) 。 这 是 停止 一 个 已 失去 控制 程序 的 方法 。 (第 18 章 将 说 明 

此 信号 可 被 映射 为 终端 上 的 任 一 字符 。) 

“硬件 异 单产 生 信号 : 除数 为 0、 无 效 的 内 存 引 用 等 。 这 些 条 件 通 销 
由 人 硬件 检测 到 ， 并 通知 内 核 。 然 后 内 核 为 该 条 件 发 生 时 正在 运行 的 进 


程 产生 适当 的 信号 。 例 如 ， 对 执行 一 个 无 歼 内 存 引用 的 进程 产生 
SIGSEGV 信 号。 

“进程 调用 kill(2) 函 数 可 将 任意 信号 发 送 给 另 一 个 进程 或 进程 组 。 目 
然 ， 对 此 有 所 限制 : 接收 信号 进程 和 发 送信 号 进程 的 所 有 者 必须 相 
同 ， 或 发 送信 号 进程 的 所 有 者 必须 是 超级 用 户 。 

用 户 可 用 kill(1) 命 令 将 信号 发 送 给 其 他 进程 。 此 命令 只 是 ki 函数 
的 接口 。 常 用 此 命令 终止 一 个 失控 的 后 台 进 程 。 

* 当 检测 到 某 种 软件 条 件 已 经 发 生 ， 并 应 将 其 通知 有 关 进 程 时 也 产 
生 信号 。 这 里 指 的 不 是 硬件 产生 条 件 (如 除 以 0) ， 而 是 软件 条 件 。 例 
如 SIGURG (在 网 络 连接 上 传 来 带 外 的 数据 ) 、SIGPIPE (在 管道 的 读 
进程 已 终止 后 ， 一 个 进程 写 此 管道 ) 以 及 SIGALRM (进程 所 设置 的 定 
时 器 已 经 超时 ) 。 

信号 是 异步 事件 的 经 典 实例 。 产 生 信号 的 事件 对 进程 而 言 是 随机 
出 现 的 。 进 程 不 能 简单 地 测试 一 个 变量 (如 ermo) 来 判断 是 否 发 生 了 
一 个 信号 ， 而 是 必须 告诉 内 核 “ 在 此 信号 发 生 时 ， 请 执行 下 列 操作 ”。 

在 某 个 信号 出 现时 ， 可 以 告诉 内 核 按 下 列 3 种 方式 之 一 进行 处 理 ， 
我 们 称 之 为 信号 的 处 理 或 与 信号 相关 的 动作 。 

(1) 忽略 此 信号 。 大 多 数 信和 号 都 可 使 用 这 种 方式 进行 处 理 ， 但 有 
两 种 信和 号 却 决 不 能 被 忽略 。 它 们 是 SIGKILL 和 SIGSTOP。 这 两 种 信号 
不 能 被 忽略 的 原因 是 : 它们 向 内 核 和 超级 用 户 提 供 了 使 进程 终止 或 停 
止 的 可 靠 方 法 。 另 外 ， 如 果 忽 略 某 些 由 硬件 异常 产生 的 信号 (如 非法 
内 存 引 用 或 除 以 0) ， 则 进程 的 运行 行为 是 未 定义 的 。 
(2) 捕 提 信号。 为 了 做 到 这 一 点 ， 要 通知 内 核 在 某 种 信号 发 生 

时 ， 调 用 一 个 用 户 函 数 。 在 用 户 函 数 中 ， 可 执行 用 户 和 希望 对 这 种 事件 
进行 的 处 理 。 例 如 ， 若 正在 编写 一 个 命令 解释 器 ， 它 将 用 户 的 输入 解 
释 为 命令 并 执行 之 ， 当 用 户 用 键盘 产生 中 断 信 号 时 ， 很 可 能 希望 该 命 
令 解 释 器 返回 到 主 循环 ， 终 止 正在 为 该 用 户 执 行 的 命令 。 如 果 捕 捉 到 


SIGCHLD 信号 ， 则 表示 一 个 子 进程 已 经 终止 ， 所 以 此 信号 的 捕捉 函数 
可 以 调用 waitpid 以 取得 该 子 进 程 的 进程 ID 以 及 它 的 终止 状态 。 又 例 
如 ， 如 果 进 程 创 建 了 临时 文件 ， 那 么 可 能 要 为 SIGTERM 信号 编写 一 
个 信号 捕捉 函数 以 清除 临时 文件 (SIGTERM 是 终止 信号 ，Kkill 命令 传 
送 的 系统 默认 信号 是 终止 信号 ) 。 注 意 ， 不 能 捕捉 SIGKILL 和 
SIGSTOP 信 号 。 

(3) 执行 系统 默认 动作 。 图 10-1 给 出 了 对 每 一 种 信号 的 系统 默认 
动作 。 注 意 ， 对 大 多 数 信 号 的 系统 默认 动作 是 终止 该 进程 。 

图 10-1 列 出 了 所 有 信号 的 名 字 ， 说 明了 哪些 系统 支持 此 信号 以 及 对 
于 这 些 信号 的 系统 默认 动作 。 在 SUS 列 中 , “表示 此 种 信号 定义 为 基 
本 POSIX.1 规范 部 分 ,“XST 表 示 该 信号 定义 在 XSI 扩 展 部 分 。 

在 系统 默认 动作 列 , “终止 +fcore” 表 示 在 进程 当前 工作 目 孙 的 core 
文件 中 复制 了 该 进程 的 内 存 映像 〈 该 文件 名 为 core， 由 此 可 以 看 出 这 种 
功能 很 久之 前 就 是 UNIX 的 一 部 分 ) 。 大 多 数 UNIX 系 统 调 试 程序 都 使 
用 core 文 件 检查 进程 终止 时 的 状态 。 


ua Linux MacOS Solaris 


SIGABRT 异常 终止 (abort) 
SIGALRM 定时 器 超时 (alarm) 
SIGBUS 硬件 故障 

SIGCANCEL | 线程 库 内 部 使 用 

SIGCHLD 子 进程 状态 改变 

SIGCONT 使 暂停 进程 继续 

SIGEMT 硬件 故障 

SIGFPE 算术 异常 

SIGFREEZE | 检查 点 冻结 

SIGHUP 连接 断 开 

SIGILL 非法 硬件 指令 

SIGINFO 键盘 状态 请 求 

SIGINT 终端 中 斯 符 

SIGIO 异步 IO 

SIGIOT 硬件 故障 

SIGJVMI Java 虚拟 机 内 部 使 用 
SIGJVM2 Java 虚拟 机 内 部 使 用 
SIGKILL 终止 

SIGLOST 资源 丢失 

SIGLWP 线程 库 内 部 使 用 

SIGPIPE 写 至 无 读 进程 的 管道 
SIGPOLL 可 轮 询 事件 (poll) 
SIGPROF 梗概 时 间 超 时 (setitimer) 
SIGPWR 电源 失效 /重启 动 

SIGQUIT 终端 退出 符 

SIGSEGV 无 效 内 存 引 用 

SIGSTKFLT | 协 处 理 器 栈 故 障 

SIGSTOP 

SIGSYS 

SIGTERM 

SIGTHAW Fj 

SIGTHR 线程 库 内 部 使 用 

SIGTRAP 硬件 故障 

SIGTSTP 终端 停止 符 

SIGTTIN he tty 

SIGTTOU 台 写 问 控 制 tty 

SIGURG dé 情况 ( 套 接 字 ) 
SIGUSR1 用 户 定义 信号 

SIGUSR2 用 户 定义 信号 

SIGVTALRM | 虚拟 时 间 病 钟 (setitimer) 
SIGWAITING | 线程 库 内 部 使 用 

SIGWINCH “| 终端 窗口 大 小 改变 

SIGXCPU 超过 CPU 限制 (setrlimit) 
SIGXFSZ 超过 文件 长 度 限 制 (setrlimit) PE 
SIGXRES 超过 资源 控制 忽略 


图 10-1 UNIX 系 统 信 号 


产生 core 文 件 是 大 多 数 UNIX 系 统 的 实现 功能 。 虽 然 该 功能 不 是 
POSIX.1 的 组 成 部 分 ， 但 在 Single UNIX Specification XSI 的 扩展 部 分 
中 ， 这 一 功能 作为 一 个 次 在 的 特定 实现 的 动作 被 提 及 。 

在 不 同 的 实现 中 ，core 文件 的 名 字 可 能 不 同 。 例 如 ， 在 FreeBSD 
8.0 F, core 文件 名 为 cmdname.core， 其 中 cmdname 是 接收 到 信和 号 的 进 
程 所 执行 的 命令 名 。 在 Mac OS X 10.6.8 中 ，core 文 件 名 是 core.pid， 其 
中 ，pid 是 接收 到 信号 的 进程 的 ID。 (这 些 系 统 允 许 经 sysctl 参 数 配 置 
coe 文件 名 。 在 Linux 3.20 中 , core 文件 名 通 
过 /proc/sys/kernel/core_pattern 进 行 配 置 。) 

大 多 数 实现 在 相应 进程 的 工作 目录 中 包含 core 文 件 项 ;但 Mac OS 
X 将 所 有 core 文 件 都 放置 在 /cores 目 录 中 。 

在 下 列 条 件 下 不 产生 core 文 件 : (a) 进程 是 设置 用 户 ID 的 ， 而 且 
当前 用 户 并 非 程序 文件 的 所 有 者 ; (b) 进程 是 设置 组 ID 的 ， 而 且 当 前 
用 户 并 非 该 程序 文件 的 组 所 有 者 ; (0 用 户 没 有 写 当 前 工作 目录 的 权 
R; (0) 文件 已 存在 ， 而 且 用 户 对 该 文件 设 有 写 权 限 ; (e) 文件 太 
X (回忆 7.11 节 中 的 RLIMIT_CORE 限 制 ) 。core 文 件 的 权限 (假定 该 
文件 在 此 之 前 并 不 存在 ) 通常 是 用 户 读 / 写 ， 但 Mac OS X 只 设置 为 用 户 
ix o 

在 图 10-1 说 明 中 的 “硬件 故障 ?对 应 于 实现 定义 的 硬件 故障 。 这 些 名 
字 中 有 很 多 取 自 UNIX 系 统 早 先 在 PDP-11 上 的 实现 。 请 查看 你 所 使 用 系 
统 的 手册 ， 以 确切 地 弄 清楚 这 些 信号 对 应 于 哪些 错误 类 型 。 

下 面 较 详细 地 逐一 说 明 这 些 信 号 。 

SIGABRT 调用 abort 函 数 时 ( 见 10.17 节 ) 产生 此 信和 号。 进程 异常 终 
IE 2 

SIGALRM = Halarm «258 t CHI) RE SE ERSTE. P^ HERD fS o PE 
细 情 况 见 10.10 节 。 若 由 setitimer(2) 函 数 设置 的 间隔 时 间 已 经 超时 时 , 
也 产生 此 信号 。 


SIGBUS 指示 一 个 实现 定义 的 硬件 故障 。 当 出 现 某 些 类 型 的 内 存 故 
障 时 (如 14.8 节 中 说 明 的 ) ， 实 现 常 常 产 生 此 种 信号 。 

SIGCANCEL 这 是 Solaris 线 程 库 内 部 使 用 的 信号 。 它 不 适用 于 一 般 
N.H e 

SIGCHLD 在 一 个 进程 终止 或 停止 时 ，SIGCHLD 信 号 被 送 给 其 父 
进程 。 按 系统 默认 ， 将 忽略 此 信号 。 如 有 果 父 进程 希望 被 告知 其 子 进程 
的 这 种 状态 改变 ， 则 应 捕捉 此 信号 。 信 和 号 捕捉 函数 中 通常 要 调用 一 种 
wait 范 数 以 取得 子 进程 ID 和 其 终止 状态 。System V 的 早期 版 本 有 一 个 名 
为 SIGCLD (无 H) 的 类 似 信号 。 这 一 信号 具有 与 其 他 信和 号 不 同 的 语 
义 ，SVR2 的 手册 页 警告 在 新 的 程序 中 尽量 不 要 使 用 这 种 信号 。 (SA 
奇怪 的 是 ， 在 SVR3 和 SVR4 版 的 手册 页 中 ， 该 警告 消失 了 “。) 应 用 程 
序 应当 使 用 标准 的 SIGCHLD 信 号 ， 但 应 了 解 ， 为 了 向 后 兼容 ， 很 多 系 
统 定义 了 与 SIGCHLD 等 同 的 SIGCLD“。 如 果 有 使 用 SIGCLD 的 软件 ， 需 
要 查阅 系统 手册 ， 了 解 它 具体 的 语义 。10.7 节 将 讨论 这 两 个 信号 。 

SIGCONT 此 作业 控制 信号 发 送 给 需要 继续 运行 ， 但 当前 处 于 停止 
状态 的 进程 。 如 果 接 收 到 此 信和 号 的 进程 处 于 停止 状态 ， 则 系统 默认 动 
作 是 使 该 进程 继续 运行 ， 否 则 默认 动作 是 忽略 此 信号 。 例 如， 全 屏 编 
辑 程序 在 捕捉 到 此 信号 后 ， 使 用 信和 号 处 理 程序 发 出 重新 绘制 终端 屏幕 
的 通知 。 关 于 进一步 的 情况 见 10.21 节 。 

SIGEMT 指示 一 个 实现 定义 的 硬件 故障 。 

EMT 这 一 名 字 来 自 PDP-11 的 仿真 器 陷入 (emulator trap) 指令 。 并 
非 所 有 平台 都 支持 此 信号 。 例 如 ，Linux 只 对 SPARC、MIPS 和 PA_RISC 
等 系统 结构 文 持 SIGEMT ° 

SIGFPE 此 信号 表示 一 个 算术 运算 异常 ， 如 除 以 0、 浮 后 汶 出 等 。 

SIGFREEZE 此 信号 仅 由 Solaris 定 义 。 它 用 于 通知 进程 在 冻结 系统 
状态 之 前 需要 采取 特定 动作 ， 例 如 当 系 统 进 入 休 眼 或 挂 起 状态 时 可 能 
需要 做 这 种 处 理 。 


SIGHUP 如 果 终 端 接口 检测 到 一 个 连接 断 开 ， 则 将 此 信号 送 给 与 该 
终端 相关 的 控制 进程 〈 会 话 首 进程 ) 。 见 图 9-13， 此 信号 被 送 给 session 
结构 中 s_leader 字 段 所 指向 的 进程 。 仅 当 终端 的 CLOCAL 标 志 没 有 设置 
时 ， 在 上 述 条 件 下 才 产 生 此 信号 。 (如 果 所 连接 的 终端 是 本 地 的 ， 则 
设置 该 终端 的 CLOCAL 标 志 。 它 告诉 终端 驱动 程序 忽略 所 有 调制 解 调 
器 的 状态 行 。 第 18 章 将 说 明 如 何 设置 此 标志 。 ) 

SIGILL 此 信号 表示 进程 已 执行 一 条 非法 硬件 指令 。 

SIGINFO 这 是 一 种 BSD 信 号 ， 当 用 户 按 状 态 键 (一 般 采用 Ctrl+T) 
时 ， 终 端 驱动 程序 产生 此 信号 并 发 送 至 前 台 进 程 组 中 的 每 一 个 进程 
( 见 图 9-9) 。 此 信号 通常 造成 在 终端 上 显示 前 台 进 程 组 中 各 进程 的 状 
态 信息 。 

注意 ， 接 到 此 信号 的 会 话 首 进 程 可 能 在 后 台 ， 作 为 一 个 例子 ， 请 
参见 图 9-7。 这 区 别 于 由 终端 正常 产生 的 几 个 信号 《中 断 、 退 出 和 挂 
起 ) ， 这 些 信 号 总 是 传递 给 前 台 进 程 组 。 

如 果 会 话 首 进程 终止 ， 也 产生 此 信号 。 在 这 种 情况 ， 此 信号 送 给 
前 台 进 程 组 中 的 每 一 个 进程 。 

通常 用 此 信号 通知 守护 进程 ( 见 第 13 章 ) 再 次 读 取 它们 的 配置 文 
件 。 选 用 SIGHUP 的 理由 是 ， 守 护 进程 不 会 有 控制 终端 ， 通 常 决 不 会 接 
收 到 这 种 信号 。 

4.3BSD 的 abort 罚 数 产 生 此 信和 号。 现在 该 范 数 产生 SIGABRT 信 号 。 

虽然 Alpha 平 台 将 SIGINFO 定 义 为 与 SIGPWR 具 有 相同 值 ， 但 是 
Linux 并 不 支持 SIGINFO 信 号 。 这 更 多 是 因为 需要 对 OSF/1 开 发 的 软件 
提供 某 种 程度 的 兼容 。 

SIGINT 当 用 户 按 中 断 键 〈 一 般 采 用 Delete 或 Ctrl-C) 时 ， 终 端 驱 
动 程序 产生 此 信号 并 发 送 至 前 台 进 程 组 中 的 每 一 个 进程 ( 见 图 9-9) 
当 一 个 进程 在 运行 时 失控 ， 特 别 是 它 正在 屏幕 上 产生 大 量 不 需要 的 输 
出 时 ， 常 用 此 信号 终止 它 。 


SIGIO 此 信号 指示 一 个 异步 JO 事 件 。 在 14.5.2 节 中 将 对 此 进行 讨 
论 。 

在 图 10-1 中 ， 对 SIGIO 的 系统 默认 动作 是 终止 或 忽略 。 遗 憾 的 是 ， 
这 依赖 于 系统 。 在 System V 中 ，SIGIO 与 SIGPOLL 相 同 ， 其 默认 动作 是 
终止 此 进程 。 在 BSD 中 ， 其 默认 动作 是 名 上 略 此 信号 。 

Linux 3.2.0 和 Solaris 10 将 SIGIO 定 义 为 与 SIGPOLL 具有 相同 值 ， 所 
以 默认 行为 是 终止 该 进程 。 在 FreeBSD 8.0 和 Mac OS X 10.6.8 中 ， 默 认 
行为 是 忽略 该 信号 。 

SIGIOT 这 指示 一 个 实现 定义 的 硬件 故障 。 

IOT 这 个 名 字 来 自 于 PDP-11， 它 是 PDP-11 计 算 机 “输入 /输出 TRAP” 

(input/output TRAP) 指令 的 缩写 。System V 的 早期 版 本 ， 由 abort 函 数 
产生 此 信和 号。 该 妙 数 现在 产生 SIGABRT 信 和 号。 

FreeBSD 8.0、Linux 3.2.0、Mac OS X 10.6.8 和 Solaris 10 将 SIGIOT 
定义 为 与 SIGABRT 具 相同 值 。 

SIGJVM1 Solaris 上 为 Java 虚 拟 机 预 留 的 一 个 信号 。 

SIGJVM2 Solaris 上 为 Java 虚 拟 机 预 留 的 男 一 个 信号。 

SIGKILL 这 是 两 个 不 能 被 捕捉 或 忽略 信号 中 的 一 个 。 它 向 系统 管 
理 员 提 供 了 一 种 可 以 杀 死 任 一 进程 的 可 靠 方法 。 

SIGLOST 运行 在 Solaris NFSv4 客 户 端 系统 中 的 进程 ， 恢 复 阶段 不 
能 重新 获得 锁 ， 此 时 将 由 这 个 信和 号 通知 该 进程 。 

SIGLWP 此 信号 由 Solaris 线 程 库 内 部 使 用 ， 并 不 做 一 般 使 用 。 在 
FreeBSD 中 ，SIGLWP 是 SIGTHR 的 别名 。 

SIGPIPE 如 果 在 管道 的 读 进程 已 终止 时 写 管 道 ， 则 产生 此 信号 。 
15.2 节 将 说 明 管 道 。 当 类 型 为 SOCK_STREAM 的 套 接 字 已 不 再 连接 
上 时， 进程 写 该 套 接 字 也 产生 此 信和 号。 我 们 将 在 第 16 章 说 明 套 接 字 。 

SIGPOLL 这 个 信号 在 SUSv4 中 已 被 标记 为 弃 用 ， 将 来 的 标准 可 能 
会 将 此 信号 移 除 。 当 在 一 个 可 轮 询 设备 上 发 生 一 个 特定 事件 时 产生 此 
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SIGIO 和 SIGURG 信 号 接近 。 在 Linux 和 Solaris 中 ，SIGPOLL 定 义 为 与 
SIGIO 具 有 相同 值 。 

SIGPROF 这 个 信号 在 SUSv4 中 已 被 标记 为 弃 用 ， 将 来 的 标准 可 能 
会 将 此 信号 移 除 。 当 setitimer(2) 范 数 设 置 的 梗概 统计 间隔 定时 器 

(profiling interval timer) 已 经 超时 时 产生 此 信号。 

SIGPWR 这 是 一 种 依赖 于 系统 的 信号 。 它 主要 用 于 具有 不 间断 电 
源 (UPS) 的 系统 。 如 果 电 源 失 效 ， 则 UPS 起 作用 ， 而 且 通 常 软件 会 接 
到 通知 。 在 这 种 情况 下 ， 系 统 依靠 蓄电池 电源 继续 运行 ， 所 以 无 须 做 
任何 处 理 。 但 是 如 果 鞭 电池 也 将 不 能 支持 工作 ， 则 软件 通常 会 再 次 接 
到 通知 ， 此 时 ， 系 统 必 项 使 其 各 部 分 都 停止 运行 。 这 时 应 当 发 送 
SIGPWR 信和 号。 在 大 多 数 系 统 中 ， 接 到 蓄电池 电压 过 低 信息 的 进程 将 
言 号 SIGPWR 发 送 给 init 井 程 ， 然 后 由 init 处 理 停机 操作 。 

Solaris 10 和 有 些 Linux 版 本 在 inittab 文 件 中 有 两 个 记录 项 用 于 此 种 
目的 : powerfail 以 及 powerwait (或 powerokwait) 。 

在 图 10-1 中 ， 我 们 将 SIGPWR 的 默认 动作 标记 为 “终止 或 名 上 略 ”。 遗 
憾 的 是 ， 这 种 默认 动作 依赖 于 系统 。Linux 对 此 的 默认 动作 是 终止 相关 
进程 ， 而 Solaris 的 默认 动作 是 名 略 该 信号 。 

SIGQUIT 当 用 户 在 终端 上 按 退 出 键 〈 一 般 采 用 Ctrl+) 时 ， 中 断 驱 
动 程序 产生 此 信号 ， 并 发 送 给 前 台 进 程 组 中 的 所 有 进程 ( 见 图 9-9) 。 
此 信号 不 仅 终止 前 台 进 程 组 (如 SIGINT 所 做 的 那样 ) ， 同 时 产生 一 个 
core 文 件 £ 

SIGSEGV 指示 进程 进行 了 一 次 无 效 的 内 存 引 用 (通常 说 明 程 序 有 
错 ， 比 如 访问 了 一 个 未 经 初始 化 的 指针 ) 。 

名 字 SEGV 代 表 “ 段 违例 ” (segmentation violation) ° 

SIGSTKFLT 此 信号 仅 由 Linux 定 义 。 它 出 现在 Linux 的 早期 版 本 ， 
企图 用 于 数学 协 处 理 器 的 栈 故 障 。 该 信号 并 非 由 内 核 产生 ， 但 仍 保留 


以 向 后 兼容 。 

SIGSTOP 这 是 一 个 作业 控制 信号 ， 它 停止 一 个 进程 。 它 类 似 于 交 
互 停止 信号 (SIGTSTP) ,但 是 SIGSTOP 不 能 被 捕捉 或 忽略 。 

SIGSYS 该 信号 指示 一 个 无 效 的 系统 调用 。 由 于 某 种 未 知 原因 ， 进 
程 执行 了 一 条 机 器 指令 ， 内 核 认 为 这 是 一 条 系统 调用 ， 但 该 指令 指示 
系统 调用 类 型 的 参数 却 是 无 效 的 。 这 种 情况 是 可 能 发 生 的 ， 例 如 ， 若 
用 户 编写 了 一 道 使 用 新 系统 调用 的 程序 ， 然 后 运行 该 程序 的 二 进 制 可 
执行 代码 ， 而 所 用 的 操作 系统 却 是 不 支持 该 系统 调用 的 较 早 版 本 ， 于 
是 就 出 现 上 述 情 况 。 

SIGTERM 这 是 由 kill(1) 命 令 发 送 的 系统 默认 终止 信号 。 由 于 该 信 
号 是 由 应 用 程序 捕获 的 ， 使 用 SIGTERM 也 让 程序 有 机 会 在 退出 之 前 做 
好 清理 工作 ， 从 而 优雅 地 终止 〈 相 对 于 SIGKILL 而 言 。SIGKILL 不 能 被 
捕捉 或 者 忽略 ) 。 

SIGTHAW 此 信号 仅 由 Solaris 定 义 。 在 被 挂 起 的 系统 恢复 时 ， 该 信 
号 用 于 通知 相关 进程 ， 它 们 需要 采取 特定 的 动作 © 

SIGTHR FreeBSD 线 程 库 预 留 的 信号 ， 它 的 值 定 义 或 与 SIGLWP 相 
同 。 

SIGTRAP 指示 一 个 实现 定义 的 硬件 故障 。 

此 信和 号 名 来 自 于 PDP-11 的 TRAP 指 令 。 当 执行 断 点 指令 时 ， 实 现 常 
用 此 信和 号 将 控制 转移 至 调试 程序 。 

SIGTSTP 交互 停止 信号 ， 当 用 户 在 终端 上 按 挂 起 键 (一 般 采 用 
Ctrl+Z) 时 ， 终 端 驱 动 程序 产生 此 信号 。 该 信号 发 送 至 前 台 进 程 组 中 的 
所 有 进程 (参见 图 9-9) 。 

遗憾 的 是 ， 停 止 具 有 不 同 的 含义 。 当 讨论 作业 控制 和 信和 号 时 ， 我 
们 谈 及 停止 和 继续 作业 。 但 是 ， 终 端 驱动 程序 一 直 使 用 术语 “停止 * 表 
示 用 Ctrl+S 字 符 终 止 终端 输 出 ， 为 了 继续 启动 该 终端 输出 ， 则 用 Ctn+Q 


字符 。 为 此 ， 终 端 驱 动 程序 称 产生 交互 停止 信号 的 字符 为 挂 起 字符 ， 
而 非 停 止 字符 。 

SIGTTIN 当 一 个 后 台 进 程 组 进程 试图 读 其 控制 终端 时 ， 终 端 驱 动 
程序 产生 此 信号 ( 见 9.8 节 中 对 此 问题 的 讨论 ) 。 在 下 列 例外 情形 下 不 
产生 此 信号 : (a) 读 进程 忽略 或 阻塞 此 信号 ;， b) 读 进 程 所 属 的 进 
程 组 是 孤儿 进程 组 ， 此 时 读 操作 返回 出 错 ，errmmo 设 置 为 EIO。 

SIGTTOU 当 一 个 后 台 进 程 组 进程 试图 写 其 控制 终端 时 ， 终 端 驱 动 
程序 产生 此 信号 〈 见 9.8 世 对 此 问题 的 讨论 ) 。 与 上 面 所 述 的 SIGTTIN 
信号 不 同 ， 一 个 进程 可 以 选择 允许 后 台 进 程 写 控制 终端 。 第 18 章 将 讨 
论 如 何 更 改 此 选项 。 

如 果 不 允 许 后 台 进 程 写 ， 则 与 SIGTTIN 相 似 ， 也 有 两 种 特殊 情 
Bi: (a) 写 进 程 忽略 或 阻塞 此 信号 ; (b) 写 进 程 所属 进 程 组 是 孤儿 
进程 组 。 在 第 2 种 情况 下 不 产生 此 信号 ， 写 操作 返回 出 销 ，errno 设 置 为 
EIO ° 

不 论 是 否 人 允许 后 台 进 程 写 ， 一 些 除 写 以 外 的 下 列 终端 操作 也 能 
生 SIGTTOU 信 号 ， 如 tcsetattr ^ tcsendbreak ^ tcdrain ^ tcflush 、tcflow 以 
及 tcsetpgrp。 第 18 章 将 说 明 这 些 终 端 操 作 。 

SIGURG 此 信号 通知 进程 已 经 发 生 一 个 紧急 情况 。 在 网 络 连接 上 
接 到 带 外 的 数据 时 ， 可 选择 地 产生 此 信号。 

SIGUSR1 这 是 一 个 用 户 定义 的 信号 ， 可 用 于 应 用 程序 。 

SIGUSR2 这 是 男 一 个 用 户 定义 的 信号 ， 与 SIGUSR1 相 似 ， 可 用 于 
应 用 程序 。 

SIGVTALRM 当 一 个 由 setitimer(2) 函 数 设置 的 虚拟 间隔 时 间 已 经 超 
时 时 ， 产 生 此 信和 号。 

SIGWAITING 此 信号 由 Solaris 线 程 库 内 部 使 用 ， 不 做 他 用 o 

SIGWINCH 内 核 维 持 与 每 个 终端 或 伪 终 端 相 关联 窗口 的 大 小 。 进 
程 可 以 用 ioctl 函 数 (0118.12 $) 得 到 或 设置 窗口 的 大 小 。 如 果 进 程 用 


ioctl 的 设置 窗口 大 小 命令 更 改 了 窗口 大 小 ， 则 内 核 将 SIGWINCH 信 号 
发 送 至 前 台 进 程 组 。 

SIGXCPU Single UNIX Specification 的 XSI 扩 展 支持 资源 限制 的 概 
4 (07.11) 。 如 果 进 程 超过 了 其 软 CPU 时 间 限 制 ， 则 产生 此 信和 号。 

在 图 10-1 中 ， 对 于 SIGXCPU 的 默认 动作 说 明 为 “终止 或 终止 
+core” ° 该 默认 动作 依赖 于 控 作 系统 。Linux 3.2.0 和 Solaris 10 支 持 的 默 
认 动 作 是 终止 并 创建 core 文 件 ，FreeBSD 8.0 和 Mac OS X 10.6.8 支 持 的 
默认 动作 是 终止 且 不 产生 core 文 件 。Single UNIX Specification 要 求 该 默 
认 动 作 是 ， 异 常 终止 该 进程 ， 是 否 创建 core 文 件 则 留 给 实现 决定 。 

SIGXFSZ 如 果 进 程 超过 了 其 软文 件 长 度 限 制 〈 见 7.11 节 ) ， 则 产 
生 此 信和 号。 

如 同 SIGXCPU 一 样 ， 针 对 SIGXFSZ 的 默认 动作 依赖 于 操作 系统 。 
Linux 3.2.0 和 Solaris 10 对 此 信号 的 默认 动作 是 终止 并 创建 core 文 件 。 
FreeBSD 8.0 和 Mac OS X 10.6.8 文 持 的 默认 动作 是 终止 且 不 产生 core 文 
件 。Single UNIX Specification 要 求 该 默认 动作 是 异常 终止 该 进程 ， 是 否 
创建 core 文 件 则 留 给 实现 决定 。 

SIGXRES 此 信号 仅 由 Solaris 定 义 。 可 选择 地 使 用 此 信号 以 通知 进 
程 超 过 了 预 配置 的 资源 值 。Solaris 资 源 限制 机 制 是 一 种 通用 设施 ， 用 于 
控制 在 独立 应 用 集 之 间 共 享 资源 的 使 用 。 


10.3 EK ZW signal 


UNIX AS fa Lil eei] 88) O signal Ex BX o 
#include <signal.h> 
void (*signal(int signo, void (*func)(int)))(int); 


退回 值 : 知 成 功 ， 返 回 以 前 的 信号 处 理 配 置 ; ate, GER[BSIG ERR 


signal EH Zi HISO C 定 义 。 因 为 ISO C 不 涉及 多 进程 、 进 程 组 以 及 终 
端 1/O 等 ， 所 以 它 对 信号 的 定义 非常 含糊 ， 以 人 至于 对 UNIX 系 统 而 言 儿 平 
ZZ JG Hb o 

从 UNIX System VIKA ASCH Sc Fsional WAL, [E TX ER Cp EIA AJ 
不 可 靠 信 号 语义 (10.4 节 将 说 明 这 些 旧 的 语义 ) 。 提 供 此 函数 主要 是 为 
了 向 后 兼容 要 求 此 旧 语 义 的 应 用 程序 ， 新 应 用 程序 不 应 使 用 这 些 不 可 
SER ° 

4.4BSD 也 提供 signal 函数 ， 但 它 是 按照 sigaction HAE LY 

(10.14 市 将 说 明 sigaction 函数 ) ， 所 以 在 4.4BSD 之 下 使 用 它 提供 新 

的 可 靠 信号 语义 。 目 前 大 多 数 系 统 亲 人 循 这 种 策略 ， 但 Solaris 10 沿 用 
System V signal 函 数 的 语义 。 

因为 signal 的 语义 与 实现 有 天， 所 以 最 好 使 用 sigaction 函 数 代 蔡 
signal 函 数 。 在 10.14 世 讨论 sigaction 函 数 时 ， 提 供 了 使 用 该 函数 的 signal 
的 一 个 实现 。 本 书 中 的 所 有 实例 均 使 用 图 10-18 中 给 出 的 signal 画 数 ， 这 
样 不 管 使 用 何 种 平台 都 可 以 有 一 致 的 语义 。 

signo 参 数 是 图 10-1 中 的 信号 名 。func 的 值 是 常量 SIG_IGN、 人 常量 
SIG. DFL 或 当 接 到 此 信号 后 要 调用 的 函数 的 地 址 。 如 宁 指 定 
SIG. IGN, ， 则 向 内 核 表 示 和 忽略 此 信号 ( 记 住 有 两 个 信号 SIGKILL 和 
SIGSTOP 不 能 忽略 ) 。 如 果 指 定 SIG_DFL ， 则 表示 接 到 此 信号 后 的 动 
作 是 系统 默认 动作 〈 见 图 10-1 中 的 最 后 一 列 ) 。 当 指定 函数 地 址 时 ， 则 
在 信号 发 生 时 ， 调 用 该 男 数 ， 我 们 称 这 种 处 理 为 捕捉 该 信号 ， 称 此 男 
数 为 信号 处 理 程 序 (signal handler) 或 信号 捕捉 函数 (signal-catching 
function) 。 

signal 函数 原型 说 明 此 函数 要 求 两 个 参数 ， 返 回 一 个 函数 指针 ， 而 
该 指针 所 指向 的 函数 无 返回 值 (void) 。 第 一 个 参数 signo 是 一 个 整 型 
数 ， 第 二 个 参数 是 函数 指针 ， 它 所 指向 的 函数 需要 一 个 整 型 参数 ， 无 
REME ° signal 的 返回 值 是 一 个 函数 地 址 ， 该 函数 有 一 个 整 型 参数 (HII 


最 后 的 (int)) 。 用 自然 语言 来 描述 也 就 是 要 向 信号 处 理 程序 传送 一 个 整 
型 参数 ， 而 它 却 无 返回 值 。 当 调用 signal 设 置信 号 处 理 程序 时 ， 第 二 个 
参数 是 指向 该 函数 〈 也 就 是 信号 处 理 程序 ) 的 指针 。signal 的 返回 值 则 
是 指向 在 此 之 前 的 信号 处 理 程序 的 指针 。 
很 多 系统 用 附加 的 依赖 于 实现 的 参数 来 调用 信号 处 理 程序 。10.14 
节 将 对 此 做 进一步 说 明 。 
ANT FP A Br aN BY signal Ei SUR A BRT, We EAR 
typedef[Plauger 1992]， 则 可 使 其 简单 一 些 。 
typedef void Sigfunc(int); 
Ya, R[signalENZAUm 70 55 py: 
Sigfunc *signal(int, Sigfunc *); 
我 们 已 将 此 typedef 包 括 在 apue.h 文 件 中 ( 见 附 录 B) ， 并 随 本 章 中 
的 函数 一 起 使 用 。 
如 果 查 看 系统 的 头 文件 <signal.h>， 则 很 可 能 会 找到 下 列 形式 的 声 
HH: 
#define SIG. ERR (void (*)0)-1 
#define SIG DFL (void (*)())0 
#define SIG IGN (void (*)0)1 
ES SE D HIERO “Fea KRIET, AKT BMS 
, MAAR” ° signal] 8 — 1 2 28S RO IRE Bcc THEE REIR. e 
这 些 常 量 所 使 用 的 3 个 值 不 一 定 是 -1、0 和 1， 但 它们 必须 是 3 个 值 而 决 
不 能 是 任 一 函数 的 地 址 。 大 多 数 UNIX 系 统 使 用 上 面 所 示 的 值 。 
实例 
图 10-2 给 出 了 一 个 简单 的 信号 处 理 程序 ， 它 捕捉 两 个 用 户 定义 的 信 
号 并 打印 信号 编号 。10.10 节 将 说 明 pause 函 数 ， 它 使 调用 进程 在 接 到 一 
信和 号 前 挂 起 。 


s 


#include "apue.h" 
static void sig usr(int); /* one handler for both signals */ 


int 
main (void) 
{ 
if (signal(SIGUSR1, sig_usr) == SIG_ERR) 
err sys("can't catch SIGUSRI1"); 
if (signal(SIGUSR2, sig usr) -- SIG ERR) 
err sys("can't catch SIGUSR2"); 
for tè v) 
pause (); 


) 


static void 


sig usr(int signo) /* argument is signal number */ 


if (signo == SIGUSR1) 
printf ("received SIGUSR1\n") ; 
else if (signo == SIGUSR2) 
printf ("received SIGUSR2\n") ; 
else 
err dump("received signal %d\n", signo); 


图 10-2 捕捉 SIGUSR1 和 SIGUSR2 的 简单 程序 

我 们 使 该 程序 在 后 台 运 行 ， 并 且 用 kill(D) 命 令 将 信号 发 送 给 它 。 注 
意 ， 在 UNIX 系 统 中 ， 杀 死 (kill) 这 个 术语 是 不 恰当 的 。kill(1) 命 令 和 
kill(2) 函 数 只 是 将 一 个 信号 发 送 给 一 个 进程 或 进程 组 。 该 信号 是 否 终 
进程 则 取决 于 该 信号 的 类 型 ， 以 及 进程 是 否 安排 了 捕捉 该 信号 。 

$ /a.out & 在 后 台 局 动 进程 

[1] 7216 作业 控制 shel 打 印 作 业 编 号 和 进程 ID 


$ kill -USR1 7216 回 该 进程 发 送 SIGUSR1 
received SIGUSR1 
$ kill -USR2 7216 癌 该 进程 发 送 SIGUSR2 
received SIGUSR2 


$ kill 7216 回 该 进程 发 送 SIGTERM 


[1]+ Terminated ./a.out 

因为 执行 图 10-2 程 序 的 进程 不 捕捉 SIGTERM 信 和 号， 而 对 该 信号 的 
系统 默认 动作 是 终止 ， 所 以 当 回 该 进程 发 送 SIGTERM 信 号 后 ， 该 进程 
就 终止 。 

1. 程序 启动 

当 执行 一 个 程序 时 ， 所 有 信和 号 的 状态 都 是 系统 默认 或 忽略 。 通 常 
所 有 信和 号 都 被 设置 为 它们 的 黑 认 动作 ， 除 非 调用 exec 的 进程 包 略 该 信 
号 。 确 切 地 讲 ，exec 函 数 将 原先 设置 为 要 捕捉 的 信号 都 更 改 为 默认 动 
作 ， 其 他 信和 号 的 状态 则 不 变 (一 个 进程 原先 要 捕 提 的 信号 ， 当 其 执行 
一 个 新 程序 后 ， 束 不 能 再 捕捉 了 ， 因 为 信号 捕捉 函数 的 地 址 很 可 能 在 
所 执行 的 新 程序 文件 中 已 无 意义 ) 。 

一 个 具体 例子 是 一 个 交互 shell 如 何 处 理 针 对 后 台 进 程 鸭 中 断 和 退 
出 信号 。 对 于 一 个 非 作 业 控 制 shell， 当 在 后 台 执 行 一 个 进程 时 ， 例 
如 : 

cc main.c & 

shell 目 动 将 后 台 进 程 对 中 断 和 退出 信号 的 处 理 方 式 设 置 为 忽略 。 
于 是 ， 当 按 下 中 断 字 符 时 就 不 会 影响 到 后 台 进 程 。 如 果 没 有 做 这 样 的 
处 理 ， 那 么 当 按 下 中 断 字 符 时 ， 它 不 但 终止 前 合 进程 ， 也 终止 所 有 后 
台 进 程 。 

很 多 捕捉 这 两 个 信号 的 交互 程序 具有 下 列 形式 的 代码 : 


void sig_int(int), sig. quit(int); 

if (signal(SIGINT, SIG IGN) != SIG IGN) 
signal(SIGINT, sig. int); 

if (signal(SIGQUIT, SIG IGN) != SIG IGN) 
signal(SIGQUIT, sig quit); 


这 样 处 理 后 ， 仅 当 SIGINT 和 SIGQUIT 当 前 未 被 忽略 时 ， 进 程 才 会 
捕捉 它们 。 

从 signal 的 这 两 个 调用 中 也 可 以 看 到 这 种 函数 的 限制 : 不 改变 信和 号 
的 处 理 方式 就 不 能 确定 信号 的 当前 处 理 方式 。 我 们 将 在 本 章 的 稍 后 部 
分 说 明 使 用 sigaction 函 数 可 以 确定 一 个 信号 的 处 理 方式 ， 而 无 需 改 变 
它 o 

2. 进程 创建 

当 一 个 进程 调用 fork 时 ， 其 子 进 程 继承 父 进程 的 信号 处 理 方 式 。 
为 子 进程 在 开始 时 复制 了 父 进 程 内 存 映像 ， 所 以 信和 号 捕捉 函数 的 地 址 
在 子 进程 中 是 有 意义 的 。 


10.4 不 可 靠 的 信号 


在 早期 的 UNIX 版 本 中 (如 V7) ， 信 和 号 是 不 可 靠 的 。 不 可 靠 在 这 里 
指 的 是 ， 信 和 号 可 能 会 丢失 : 一 个 信号 发 生 了 ， 但 进程 却 可 能 一 直 不 知 
道 这 一 点 。 同 时 ， 进 程 对 信和 号 的 控制 能 力也 很 差 ， 它 能 捕捉 信号 或 忽 
略 它 。 有 时 用 户 和 希望 通知 内 核 阻 塞 某 个 信号 : 不 要 忽略 该 信号 ， 在 其 
发 生 时 记 住 它 ， 然 后 在 进程 做 好 了 准备 时 再 通知 它 。 这 种 阻塞 信号 的 
能 力 当时 并 不 具备 。 

4.2BSD 对 信号 机 制 进行 了 更 改 ， 提 供 了 被 称 为 可 菲 信 号 的 机 制 。 
然后 ，SVR3 也 修改 了 信号 机 制 ， 提 供 了 System V 可 靠 信 号 机 制 。 
POSIX.1 选 择 了 BSD 模 型 作为 其 标准 化 的 基础 。 

早期 版 本 中 的 一 个 问题 是 在 进程 每 次 接 到 信号 对 其 进行 处 理 时 ， 
随即 将 该 信号 动作 重 置 为 默认 值 〈 在 前 面 运行 图 10-2 程 序 时 ， 每 种 信和 号 
只 捕捉 一 次 ， 从 而 回避 了 这 一 点 ) 。 在 描述 这 些 早 期 系统 的 编程 书籍 


中 ， 有 一 个 经 典 实例 ， 它 与 如 何 处 理 中 断 信 号 相关 ， 其 代码 与 下 面 所 
示 的 相似 : 


int sig. int(); /* my signal handling function */ 


signal(SIGINT, sig. int); /* establish handler */ 

sig. int() 

{ 

signal(SIGINT, sig_int); /* reestablish handler for next time */ 


/* process the signal ... */ 


[xp comm 


EREA — P alle: 在 进程 不 硕 望 某 种 信号 发 生 时 ， 
EMER A fa S o 进程 能 做 的 一 切 束 是 忽略 该 信号 。 有 时 希望 通知 
系统 “阻止 下 列 信号 发 生 ， 如 采 它 们 确实 产生 了 ， 请 记 住 它们 。?” 能 够 
显现 这 种 缺陷 的 的 一 个 经 典 实例 是 下 列 程序 段 ， 它 捕捉 一 个 信号 ， 然 
后 设置 一 个 表示 该 信号 已 发 生 的 标志 : 


int sig. int(); /* my signal handling function */ 


r 


intsig int flag; /* set nonzero when signal occurs */ 
main() 
{ 


} 
signal(SIGINT, sig_int); /* establish handler */ 


while (sig_int_flag == 0) 


pause(); /* go to sleep, waiting for signal */ 


sig. int() 


(由 于 早期 的 C 语 言 版 本 不 支持 ISO C 的 void 数据 类 型 ， 所 以 将 信 
号 处 理 程序 声明 为 int 类 型 。) 这 段 代 码 的 一 个 问题 是 : 在 信号 发 生 之 
后 到 信号 处 理 程序 调用 signal 函 数 之 间 有 一 个 时 间 窗 口 。 在 此 段 时 间 
中 ， 可 能 发 生男 一 次 中 断 信 号 。 第 二 个 信号 会 造成 执行 默认 动作 ， 而 
对 中 断 信 号 的 默认 动作 是 终止 该 进程 。 这 种 类 型 的 程序 段 在 大 多 数 情 
况 下 会 正 肖 工作， 使 得 我 们 认为 它们 十 正确 无 误 的 ， 而 实际 上 却 并 非 
如 此 。 


{ 

signal(SIGINT, sig_int); /* reestablish handler for next 
time */ 

sig_int_flag = 1; /* set flag for main loop to 
examine */ 
} 


其 中 ， 进 程 调 用 pause 范 数 使 目 己 休眠 ， 直 到 捕 提 到 一 个 信号 。 当 
捕捉 到 信号 时 ， 信 和 号 处 理 程序 将 标志 sig. int. flag 设置 为 非 0 值 。 从 信 
号 处 理 程序 返回 后 ， 内 核 自 动 将 该 进程 唤醒 ， 它 检测 到 该 标志 为 非 0， 
然后 执行 它 所 需 做 的 。 但 是 这 里 有 一 个 时 间 窗 口 ， 在 此 窗口 中 操作 可 
能 失误 。 如 果 在 测试 sig_int_flag 之 后 、 调 用 pause 之 前 发 生 信 号 ， 则 此 
进程 在 调用 pause 时 可 能 将 永久 休眠 (假定 此 信号 不 会 再 次 产生 ) 。 于 
是 ， 这 次 发 生 的 信号 也 就 丢失 了 。 这 是 男 一 个 例子 ， 某 段 代码 并 不 正 
确 ， 但 是 大 多 数 时 间 却 能 正常 工作 。 要 查找 并 排除 这 种 类 型 的 问题 很 
办 难 。 


早期 UNIX 系 统 的 一 个 特性 是 : 如 采 进 程 在 执行 一 个 低速 系统 调用 
而 阻塞 期 间 捕捉 到 一 个 信号 ， 则 该 系统 调用 束 被 中 断 不 再 继续 执行 。 
该 系统 调用 返回 出 请 ， 其 ermo 设 置 为 EINTR。 这样 处 理 是 因为 一 个 信 
号 发 生 了 ， 进 程 捕捉 到 它 ， 这 意味 着 已 经 发 生 了 某 种 事情 ， 所 以 是 个 
好 机 会 应 当 唤醒 阻塞 的 系统 调用 。 

在 这 里 ， 我 们 必须 区 分 系统 调用 和 碎 数 。 当 捕捉 到 某 个 信和 号 时 ， 
被 中 断 的 是 内 核 中 执行 的 系统 调用 。 

为 了 文 持 这 种 特性 ， 将 系统 调用 分 成 两 类 : 低速 系统 调用 和 其 他 
系统 调用 。 低 速 系 统 调 用 是 可 能 会 使 进程 永远 阻塞 的 一 类 系统 调用 , 
包括 : 

如果 某 些 类 型 文件 〈 如 读 管道 、 终 端 设备 和 网 络 设备 ) 的 数据 不 
存在 ， 则 读 操 作 可 能 会 使 调用 者 永远 阻 罕 ; 

如果 这 些 数据 不 能 被 相同 的 类 型 文件 立即 接受 ， 则 写 操 作 可 能 会 
TEJ HE 7k 20 KE SE ; 

“在 某 种 条 件 发 生 之 前 打开 某 些 类 型 文件 ， 可 能 会 发 生 阻 塞 (例如 
要 打开 一 个 终端 设备 ， 需 要 和 驳 等 待 与 之 连接 的 调制 解 调 器 应 答 ) ; 

pauseERZ (按照 定义 ， 它 使 调用 进程 休眠 直至 捕捉 到 一 个 信和 号 ，) 
和 wait 芳 数 ; 

* 某 些 ioct] 操 作 ; 

。 某 些 进程 间 通 信函 数 〈 见 第 15 章 ) 。 

在 这 些 低速 系统 调用 中 ， 一 个 值得 注意 的 例外 是 与 磁盘 IO 有 关 的 
系统 调用 。 虽 然 恋 、 写 一 个 磁盘 文件 可 能 暂时 阻塞 调用 者 (在 磁盘 驱 
动 程序 将 请 求 排 入 队列 ， 然 后 在 适当 时 间 执 行 请 求 期 间 ) ， 但 是 除非 
发 生硬 件 错误 ，LIO 操 作 总 会 很 快 返 回 ， 并 使 调用 者 不 再 处 于 阻塞 状 
AM o 

可 以 用 中 断 系 统 调用 这 种 方法 来 处 理 的 一 个 例子 是 : 一 个 进程 局 
动 了 读 终 端 控 作 ， 而 使 用 该 终端 设备 的 用 户 却 离开 该 终端 很 长 时 间 。 


在 这 种 情况 下 ， 进 程 可 能 处 于 阻塞 状态 儿 个 小 时 长 至 数 天 ， 除 非 系 统 
停机 ， 否 则 一 直 如 此 。 

对 于 中 断 的 read、write 系 统 调用 ，POSIX.1 的 语义 在 该 标准 的 2001 
版 有 所 改变 。 对 于 如 何 处 理 已 read ^ write 部 分 数据 量 的 相应 系统 调 
用 ， 早 期 版 本 允许 实现 目 行 选择 。 如 寿 read 系 统 调用 已 接收 并 传送 数 
据 至 应 用 程序 缓冲 区 ,但 尚未 接收 到 应 用 程序 请 求 的 全 部 数据 ， 此 时 
被 中 断 ， 操 作 系统 可 以 认为 该 系统 调用 失败 ， 并 将 ermo 设置 为 
EINTR; 另 一 种 处 理 方式 是 允许 该 系统 调用 成 功 返 回 ， 返 回 值 是 已 接 
收 到 的 数据 量 。 与 此 类 似 ， 如 若 write 已 传输 了 应 用 程序 绥 冲 区 中 的 部 
分 数据 ， 然 后 被 中 断 ， 操 作 系 统 可 以 认为 该 系统 调用 失败 ， 并 将 errno 
设置 为 EINTR; 另 一 种 处 理 方式 是 允许 该 系统 调用 成 功 返 回 ， 返 回 值 
是 已 写 部 分 的 数据 量 。 历 史上 ， 从 System V 派 生 的 实现 将 这 种 系统 调 
用 视 为 失败 ， 而 BSD 派生 的 实现 则 处 理 为 部 分 成 功 返 回 。2001 版 
POSIX.1 标 准 采 用 BSD 风 格 的 语义 。 

与 被 中 断 的 系统 调用 相关 的 问题 是 必须 显 式 地 人 处理 出 错 返 回 。 典 
型 的 代码 序列 (假定 进行 一 个 读 操 作 ， 它 被 中 断 ， 我 们 希望 重新 启动 
T) AWP: 

again: 

if ((n = read(fd, buf, BUFFSIZE)) < 0) 1 
if (errno == EINTR) 
goto again; /* just an interrupted system call */ 
/* handle other errors */ 
} 

为 了 帮助 应 用 程序 使 其 不 必 处 理 被 中 断 的 系统 调用 ，4.2BSD 引 进 
了 某 些 被 中 断 系 统 调 用 的 目 动 重 局 动 。 目 动 重 局 动 的 系统 调用 包括 : 
ioctl ` read ` readv ` write ` writev ` wait 和 waitpid。 如 前 所 述 ， 其 中 前 5 
个 钞 数 只 有 对 低速 设备 进行 操作 时 才 会 被 信号 中 断 。 而 wait 和 waitpid 


在 捕捉 到 信号 时 总 是 被 中 断 。 因 为 这 种 目 动 重启 动 的 处 理 方 式 也 会 市 
来 问题 ， 某 些 应 用 程序 并 不 希望 这 些 函 数 被 中 断后 重启 动 。 为 此 
4.3BSD 人 允许 进程 基于 每 个 信号 禁用 此 功能 。 

POSIX.1 要 求 只 有 中 断 信 号 的 SA_RESTART 标 志 有 效 时 ， 实 现 才 
重启 动 系统 调用 。 在 10.14 节 将 看 到 ，sigaction 函 数 使 用 这 个 标志 允许 应 
用 程序 请 求 重 启动 被 中 断 的 系统 调用 。 

历史 上 ， 使 用 signal 函 数 建立 信号 处 理 程 序 时 ， 对 于 如 何 处 理 被 中 
呆 的 系统 调用 ， 各 种 实现 的 做 法 各 不 相同 。System V 的 默认 工作 方式 
是 从 不 重启 动 系统 调用 。 而 BSD 则 重启 动 被 信号 中 断 的 系统 调用 。 
FreeBSD 8.0 ` Linux 3.2.0 和 Mac OS X 10.6.8 中 ， 当 信号 处 理 程序 是 用 
signal 函 数 时 ， 被 中 断 的 系统 调用 会 重 局 动 。 但 Solaris 10 的 默认 方式 
是 出 错 返 回 ， 将 ermo 设置 为 EINTR。 使 用 用 户 自 己 实 现 的 signal 函 数 
( 见 图 10-18) 可 以 避免 必须 处 理 这 些 差 异 的 麻烦 。 

4.2BSD 引 入 目 动 重 局 动 功能 的 一 个 理由 是 : 有 时 用 户 并 不 知道 所 
使 用 的 输入 、 输 出 设备 是 否 是 低速 设备 。 如 果 我 们 编写 的 程序 可 以 用 
交互 方式 运行 ， 则 它 可 能 读 、 写 终端 低速 设备 。 如 果 在 程序 中 捕捉 信 
号 ， 而 且 系 统 并 不 提供 重启 动 功 能 ， 则 对 每 次 读 、 写 系统 调用 就 要 进 
行 是 否 出 错 返 回 的 测试 ， 如 果 是 被 中 断 的 ， 则 再 调用 读 、 写 系统 调 


图 10-3 列 出 了 几 种 实现 所 提供 的 与 信号 有 关 的 函数 及 它们 的 语义 。 


信号 处 理 程 | 阻塞 信号 | 被 中 断 系 统 调用 
序 仍 被 安装 | ”的 能 力 的 自动 重启 动 ? 


ISO C. POSIX.1 未 说 明 未 说 明 未 说 明 
V7、SVR2、SVR3 

Signal SVR4, Solaris 

4.2BSD 


POSIX.1, 4.4BSD. SVR4, FreeBSD. Linux, 


sigaction : 
2 Mac OS X, Solaris 


图 10-3 几 种 信号 实现 所 提供 的 功能 

应 当 了 解 ， 其 他 厂商 提供 的 UNIX 系 统 可 能 不 同 于 图 10-3 中 所 示 的 
情况 。 例 如 ，SunOS 4.1.2 中 的 sigaction 默 认 方式 是 重启 动 被 中 断 的 系统 
调用 ， 这 与 列 在 图 10-3 中 的 各 平台 不 同 。 

在 图 10-18 中 ， 提 供 了 我 们 自己 的 signal 函 数 版 本 ， 它 自动 地 尝试 重 
启动 被 中 断 的 系统 调用 ( 除 SIGALRM 信 号外) 。 在 图 10-19 中 则 提供 
了 男 一 个 函数 signal_intr， 它 不 进行 重启 动 。 

在 14.4 节 说 明 select 和 pol 函 数 时 ， 还 将 更 多 涉及 被 中 断 的 系统 调 
用 o 


10.6 FARA 


进程 捕捉 到 信号 并 对 其 进行 处 理 时 ， 进 程 正 在 执行 的 正常 指令 序 
列 就 被 信号 处 理 程序 临时 中 断 ， 它 首先 执行 该 信和 号 处 理 程序 中 的 指 
令 。 如 果 从 信号 处 理 程序 返回 (例如 没有 调用 exit 或 longjmp) ， 则 继 
续 执 行 在 捕捉 到 信号 时 进程 正在 执行 的 正常 指令 序列 (这 类 似 于 发 生 
硬件 中 断 时 所 做 的 )  。 但 在 信号 处 理 程序 中 ， 不 能 判断 捕捉 到 信和 号 时 
进程 执行 到 何 处 。 如 果 进 程 正在 执行 malloc， 在 其 堆 中 分 配 男 外 的 存储 
空间 ， 而 此 时 由 于 捕捉 到 信号 而 插入 执行 该 信号 处 理 程序 ， 其 中 又 调 
用 malloc， 这 时 会 发 生 什 么 ? 又 例如 ， 若 进程 正在 执行 getpwnam (JL 
6.277) 这 种 将 其 结果 存放 在 静态 存储 单元 中 的 函数 ， 其 间 插 入 执行 信 
号 处 理 程 序 ， 它 又 调用 这 样 的 函数 ， 这 时 又 会 发 生 什 么 呢 ? 在 malloc 例 
子 中 ， 可 能 会 对 进程 造成 破坏 ， 因 为 malloc 通 第 为 它 所 分 配 的 存储 区 维 
护 一 个 链表 ， 而 播 入 执行 信号 处 理 程 序 时 ， 进 程 可 能 正在 更 改 此 链 
表 。 在 getpwnam 的 例子 中 ， 返 回 给 正常 调用 者 的 信息 可 能 会 被 返回 给 
言 号 处 理 程序 的 信息 鹤 盖 。 


abort 
accept 
access 

aio error 
aio return 
aio suspend 
alarm 

bind 
cfgetispeed 
cfgetospeed 
cfsetispeed 
cfsetospeed 
chdir 

chmod 

chown 


clock gettime 
close 
connect 
creat 
dup 
dup2 
execl 
execle 
execv 
execve 
EXIL 


_exit 


faccessat 
fchmod 
fchmodat 
fchown 
fchownat 
fcntl 
fdatasync 
fexecve 
fork 
fstat 
fstatat 
fsync 
ftruncate 
futimens 


getegid 


geteuid 


getgid 
getgroups 
getpeername 
getpgrp 
getpid 
getppid 
getsockname 
getsockopt 
getuid 
kill 

link 


图 10-4 信号 处 理 程序 可 以 调 


linkat 
listen 
lseek 
lstat 
mkdir 
mkdirat 
mkfifo 
mkfifoat 
mknod 
mknodat 
open 
openat 
pause 
pipe 
poll 
posix trace event 
pselect 
raise 
read 
readlink 
readlinkat 
recv 
recvfrom 
recvmsg 
rename 
renameat 


rmdir 


select 

sem post 
send 
sendmsg 
sendto 
setgid 
setpgid 
setsid 
setsockopt 
setuid 
shutdown 
sigaction 
sigaddset 
sigdelset 
sigemptyset 
sigfillset 
Sigismember 
signal 
sigpause 
Sigpending 
sigprocmask 
sigqueue 
sigset 
sigsuspend 
sleep 
Socketmark 


socket 


用 的 可 重 入 函数 


socketpair 
stat 

symlink 
symlinkat 
tcdrain 
tcflow 
tcflush 
tcgetattr 
tcgetpgrp 
tcsendbreak 
tcsetattr 
tcsetpgrp 
time 

timer getoverrun 
timer gettime 
timer settime 
times 

umask 

uname 

unlink 
ulinkat 

utime 
utimensat 
utimes 

wait 

waitpid 


write 


Single UNIX Specification 说 明了 在 信号 处 理 程序 中 保证 调用 安全 的 
函数 。 这 些 函 数 是 可 重 入 的 并 被 称 为 是 异步 信号 安全 的 (async-signal 
safe) 。 除 了 可 重 入 以 外 ,在 信号 处 理 操 作 期 间 ， 它 会 阻塞 任何 会 引起 
不 一 致 的 信号 发 送 。 图 10-4 列 出 了 这 些 异 步 信 号 安全 的 画 数 。 没 有 列 入 
图 10-4 中 的 大 多 数 函 数 是 不 可 重 入 的 ， 因 为 (a) 已 知 它们 使 用 静态 数 
HE; (b) 它们 调用 malloc 或 free; (c) 它们 是 标准 WO 函数 。 标 
准 WO 库 的 很 多 实现 都 以 不 可 重 入 方式 使 用 全 局 数据 结构 。 注 意 ， 虽 然 
在 本 书 的 某 些 实例 中 ， 信 和 号 处 理 程序 也 调用 了 printf 函 数 ， 但 这 并 不 保 
证 产生 所 期 望 的 结果 ， 信 号 处 理 程序 可 能 中 断 主 程序 中 的 printf 函 数 调 
用 。 


应 当 了 解 ， 即 使 信号 处 理 程序 调用 的 是 图 10-4 中 的 函数 ， 但 是 由 于 
每 个 线程 只 有 一 个 ermo 变 量 (回忆 1.7 节 对 ermo 和 线程 的 讨论 ; ， 所 以 
言 号 处 理 程序 可 能 会 修改 其 原先 值 。 考 虑 一 个 信号 处 理 程 序 ， 它 恰好 
在 main 刚 设置 ermo 之 后 被 调用 。 如 果 该 信号 处 理 程序 调用 read 这 类 画 
数 ， 则 它 可 能 更 改 errno 的 值 ， 从 而 取代 了 刚 由 main 设 置 的 值 。 因 此 ， 
作为 一 个 通用 的 规则 ， 当 在 信和 号 处 理 程序 中 调用 图 10-4 中 的 函数 时 ， 应 
当 在 调用 前 保存 ermno， 在 调用 后 恢复 errno。 (M4 SHR, A BATE 
到 的 信号 是 SIGCHLD ， 其 信号 处 理 程序 通常 要 调用 一 种 wait 函 数 ， 而 
各 种 wait 函 数 都 能 改变 errno。) 

注意 ， 图 10-4 没 有 包括 longjmp (7.1077) 和 siglongjmp (10.15 
T) 。 这 是 因为 主 例 程 以 非 可 重 入 方式 正在 更 新 一 个 数据 结构 时 可 能 
产生 信和 号。 如 果 不 是 从 信号 处 理 程序 返回 而 是 调用 siglongjmp， 那 么 该 
数据 结构 可 能 是 部 分 更 新 的 。 如 果 应 用 程序 将 要 做 更 新 全 局 数据 结构 
这 样 的 事情 ， 而 同时 要 捕捉 某 些 信号 ， 而 这 些 信 号 的 处 理 程序 又 会 引 
起 执行 siglongjmp， 则 在 更 新 这 种 数据 结构 时 要 阻塞 此 类 信和 号。 

实例 

图 10-5 给 出 了 一 段 程序 ， 这 上 段 程序 从 信号 处 理 程序 my_alarm 调 用 
韭 可 重 入 函数 getpwnam， 而 my_alarm 每 秒 钟 被 调用 一 次 。10.10 广 中 将 
说 明 alarm 芳 数 。 在 该 程序 中 调用 alarm 芳 数 使 得 每 秒 产 生 一 次 
SIGALRM 信 和 号。 


#include "apue.h" 
#include <pwd.h> 


static void 
my_alarm(int signo) 
{ 


struct passwd *rootptr; 


printf ("in signal handler\n"); 

if ((rootptr = getpwnam("root")) == NULL) 
err sys("getpwnam(root) error"); 

alarm(1); 


) 


int 
main (void) 
{ 


struct passwd *ptr; 


signal (SIGALRM, my alarm); 


alarm(1); 
LOR! wu) d 
if ((ptr = getpwnam("sar")) == NULL) 
err sys("getpwnam error"); 
if (strcmp(ptr-»pw name, "sar") !- 0) 


printf("return value corrupted!, pw name = %s\n", 
ptr-»pw name); 


图 10-5 在 信号 处 理 程序 中 调用 不 可 再 入 函数 

运行 该 程序 时 ， 其 结果 具有 随机 性 。 通 常 ， 在 信号 处 理 程序 经 多 
次 迭代 返回 时 ， 该 程序 将 由 SIGSEGV 信 号 终止 。 检 查 core 文 件 ， 从 中 
可 以 看 到 main 函 数 已 调用 getpwnam， 但 当 getpwnam 调 用 free 时 ， 信 和 号 处 
理 程 序 中 断 了 它 的 运行 ， 并 调用 getpwnam， 进 而 再 次 调用 free。 在 信号 
处 理 程序 调用 free 而 主 程序 也 在 调用 free 时 ，malloc 和 free 维 护 的 数据 结 
构 就 出 现 了 损坏 ， 人 偶然， 此 程序 会 运行 若干 秒 ， 然 后 因 产 生 SIGSEGV 
信号 而 终止 。 在 捕捉 到 信号 后 ， 知 main 函 数 仍 正确 运行 ， 其 返回 值 却 
有 时 销 误 ， 有 时 正确 。 


从 此 实例 中 可 以 看 出 ， 如 果 在 信号 处 理 程序 中 调用 一 个 非 可 重 入 
函数 ， 则 其 结 采 是 不 可 预知 的 。 


10.7 SIGCLDi&E Y 


SIGCLD 和 SIGCHLD 这 两 个 信号 很 容易 被 混 消 。SIGCLD (没有 
H) 是 SystemV 的 一 个 信号 名 ， 其 语义 与 名 为 SIGCHLD 的 BSD 信 和 号 不 
同 。POSIX.1 采 用 BSD 的 SIGCHLD 信 号 。 

BSD 的 SIGCHLD 信 号 语义 与 其 他 信号 的 语义 相 类 似 。 子 进程 状态 
改变 后 产生 此 信号 ， 父 进程 需要 调用 一 个 wait 函 数 以 检测 发 生 了 什么 。 

System V 处 理 SIGCLD 信 号 的 方式 不 同 于 其 他 信号 。 如 采用 signal 
或 sigset (早期 设置 信号 配置 的 ， 与 SRV3 兼 容 的 函数 ) 设置 信号 配置 ， 
则 基于 SVR4 的 系统 继承 了 这 一 具有 问题 色彩 的 传统 ( 即 兼 容 性 限 
fill) 。 对 于 SIGCLD 的 早期 处 理 方式 是 : 

(1) 如 果 进 程 明确 地 将 该 信号 的 配置 设置 为 SIG_IGN， 则 调用 进 

程 的 子 进 程 将 不 产生 僵 死 进程 。 注 意 ， 这 与 其 默认 动作 (SIG DFL) 
“忽略 ” ( 见 图 10-1) 不 同 。 子 进程 在 终止 时 ， 将 其 状态 丢弃 。 如 果 调 用 
进程 随后 调用 一 个 wait 函 数 ， 那 么 它 将 阻塞 直到 所 有 子 进 程 都 终止 ， 然 
后 该 wait 会 返回 -1， 并 将 其 errmo 设 置 为 ECHILD。 (此 信号 的 默认 配置 
是 忽略 ， 但 这 不 会 使 上 述 语 义 起 作用 。 必 须 将 其 配置 明确 指定 为 
SIG_IGN 才 可 以 。) 

POSIX.1 并 未 说 明 在 SIGCHLD 被 忽略 时 应 产生 的 后 果 ， 所 以 这 种 
ÍT H Æ IFAI ° Single UNIX Specification 的 XSI 扩 展 选 项 要 求 对 于 
SIGCHLD 文 持 这 种 行为 。 

如 果 SIGCHLD 被 包 略 ，4.4BSD 总 是 产生 僵 死 进程 。 如 果 要 避免 僵 
死 进 程 ， 则 必须 等 竺 子 进 程 。 在 SVR4 中 ， 如 果 调 用 signal 或 sigset 将 


SIGCHLD 的 配置 设置 为 忽略 ， 则 决 不 会 产生 僵 死 进程 。 本 书 讨论 的 4 种 
平台 在 此 方面 都 追随 SVR4 的 行为 。 

使 用 sigaction 可 设置 SA_ ( 见 图 10-6) 以 避免 进 
程 僵 死 。 本 书 讨论 的 4 种 平台 都 支持 这 一 

(2) MG UEM 则 内 核 立 即 检查 是 否 有 
子 进程 准备 好 被 等 待 ， 如 果 是 这 样 ， eee 

第 2 种 方式 改变 了 为 此 信号 编写 处 理 程 序 的 方法 ， 这 一 点 可 在 下 面 
的 实例 中 看 到 。 

实例 

10.4 广 曾 提 到 ， 进 入 信号 处 理 程序 后 ， 首 先 要 调用 signal 函 数 以 重 
新 设置 此 信号 处 理 程序 (在 信号 被 重 置 为 其 默认 值 时 ， 它 可 能 会 丢 
失 ， 立 即 重新 设置 可 以 减少 此 窗口 时 间 ) 。 图 10-6 展 示 了 这 一 点 。 但 此 
程序 不 能 在 某 些 传统 的 System V 平台 上 正常 工作 。 程 序 一 行 行 地 不 断 
重复 输出 “SIGCLD received”， 最 后 进程 用 完 其 栈 空 间 并 异常 终止 。 


#include "apue.h" 


#include <sys/wait.h> 


Static void sig cld(int); 
int 
main() 
( 

pid t pid; 
if (signal(SIGCLD, sig cld) 
perror("signal error"); 
((pid = fork()) < 0) { 
perror ("fork error"); 
(pid == 0) { 
sleep (2); 
exit (0); 


== g 


IE 


} else if 


} 


pause (); /* parent */ 
exit (0); 


) 


static void 


IG ERR) 


[* Child */ 


Sig cld(int signo) /* interrupts pause() */ 
( 
pid t pid; 
int status; 
printf("SIGCLD received\n") ; 
if (signal(SIGCLD, sig_cld) == SIG_ERR) /* reestablish handler */ 
perror("signal error"); 
if ((pid = wait(&status)) < 0) /* fetch child status */ 


perror ("wait error"); 


printf("pid = %d\n", pid); 


图 10-6 不 能 正常 了 


因为 基于 BSD 的 系统 通常 


所 以 FreeBSD 8.0 和 Mac OS X 
没有 出 现 此 问题 ， 其 原因 是 ， 
值 ， 但 当 一 个 进程 安排 捕捉 S 


y 


yt 


[ 作 的 System V SIGCLD 处 理 程序 


并 不 支持 早期 System V 的 SIGCLD 语 义 ， 

10.6.8 并 没有 出 现 此 问题 。Linux 3.2.0 也 
虽然 SIGCLD 和 SIGCHLD 定义 为 相同 的 
IGCHLD， 并 且 已 经 有 进程 准备 好 由 其 父 


程 等 待 时 ， 该 系统 并 不 调用 SIGCHLD 信 和 号 的 处 理 程序 。Solaris 10 
在 此 种 情况 时 确实 调用 该 信号 处 理 程序 ， 但 在 内 核 中 增加 了 避免 此 问 
题 的 代码 。 

虽然 本 书 说 明 的 所 有 4 种 平台 都 解决 了 这 一 问题 ， 但 是 应 当 意 识 到 
没有 解决 这 一 问题 的 平台 (如 AIX) 依然 存在 。 

此 程序 的 问题 是 : 在 信号 处 理 程序 的 开始 处 调用 signal， 按 照 上 述 
第 2 种 方式 ， 内 核 检 查 是 否 有 需要 等 待 的 子 进 程 (因为 我 们 正在 处 理 一 
个 SIGCLD 信 和 号， 所 以 确实 有 这 种 子 进程 ) ， 所 以 它 产 生 另 一 个 对 信和 号 
处 理 程序 的 调用 。 信 和 号 处 理 程 序 调 用 signal， 整 个 过 程 再 次 重复 。 

为 了 解决 这 一 问题 ， 应 当 在 调用 wait 取 到 子 进程 的 终止 状态 后 再 调 
用 signal。 此 时 仅 当 其 他 子 进程 终止 ， 内 核 才 会 再 次 产生 此 种 信号 。 

如 果 为 SIGCHLD 建 立 了 一 个 信号 处 理 程序 ， 又 存在 一 个 已 终止 但 
父 进 程 尚 未 等 待 它 的 进程 ， 则 是 否 会 产生 信号 ?” POSIX.1 对 此 没有 做 
说 明 。 这 就 允许 前 面 所 壕 的 工作 方式 。 但 是 ，POSIX.1 在 信号 发 生 时 并 
没有 将 信号 处 理 重 置 为 其 默认 值 〈 假 定 正 调用 POSIX.1 的 sigaction 函 数 
设置 其 配置 ) ， 于 是 在 SIGCHLD 处 理 程序 中 也 就 不 必 再 为 该 信号 指定 
一 个 信号 处 理 程序 。 

务必 了 解 你 所 用 的 系统 实现 中 SIGCHLD 信号 的 语义 。 也 应 了 解 在 
某 些 系统 中 #define SIGCHLD 为 SIGCLD 或 反之 。 更 改 这 种 信号 的 名 字 
使 你 可 以 编译 为 另 一 个 系统 编写 的 程序 ， 但 是 如 果 这 一 程序 使 用 该 信 
号 的 另 一 种 语义 ， 程 序 有 可 能 不 会 正常 工作 。 

在 本 书 说 明 的 4 种 平台 上 ， 只 有 Linux 3.2.0 和 Solaris 10 定 义 了 
SIGCLD，SIGCLD 等 同 于 SIGCHLD ° 


10.8 FS SHEE Y 


我 们 需要 先 定 义 一 些 在 讨论 信号 时 会 用 到 的 术语 。 首 先 ， 当 造成 
信号 的 事件 发 生 时 ， 为 进程 产生 一 个 信号 (或 向 一 个 进程 发 送 一 个 信 
号 ) 。 事 件 可 以 是 硬件 异常 《如 除 以 0) 、 软 件 条 件 (如 alarm 定时 器 
超时 ) 、 终 端 产生 的 信号 或 调用 kill 函数 。 当 一 个 信号 产生 时 ， 内 核 通 
常 在 进程 表 中 以 某 种 形式 设置 一 个 标志 。 

当 对 信和 号 采取 了 这 种 动作 时 ， 我 们 说 向 进程 递送 了 一 个 信号 。 在 
言 号 产生 (generation) 和 递送 (delivery) 之 间 的 时 间 间 隔 内 ， 称 信和 号 
是 未 决 的 (pending) 。 

进程 可 以 选用 “阻塞 信号 递送 ”。 如 果 为 进程 产生 了 一 个 阻塞 的 信 
号 ， 而 且 对 该 信号 的 动作 是 系统 默认 动作 或 捕捉 该 信号 ， 则 为 该 进程 
将 此 信号 保持 为 未 决 状态 ， 直 到 该 进程 对 此 信号 解除 了 阻塞 ， 或 者 将 
对 此 信号 的 动作 更 改 为 忽略 。 内 核 在 递送 一 个 原来 被 阻塞 的 信号 给 进 
程 时 (而 不 是 在 产生 该 信号 时 ) ， 才 决定 对 它 的 处 理 方 式 。 于 是 进程 
在 信号 递送 给 它 之 前 仍 可 改变 对 该 信号 的 动作 。 进 程 调用 sigpending 画 
BX (0110.13 55). 来 判定 哪些 信号 是 设置 为 阻塞 并 处 于 未 决 状态 的 。 

如 果 在 进程 解除 对 某 个 信号 的 阻塞 之 前 ， 这 种 信号 发 生 了 多 次 ， 
那么 将 如 何 呢 ?POSIX.1 人 允许 系统 递送 该 信号 一 次 或 多 次 。 如 果 递 送 该 
言 号 多 次 ， 则 称 这 些 信和 号 进行 了 排队 。 但 是 除非 支持 POSIX.1 实 时 扩 
展 ， 否 则 大 多 数 UNIX 并 不 对 信号 排队 ， 而 是 只 递送 这 种 信号 一 次 。 

SUSv4 中 ， 实 时 信号 功能 已 经 移 至 基础 规范 的 实时 扩展 部 分 。 随 
着 时 间 的 推移 ， 更 多 的 系统 即使 不 支持 实时 扩展 ， 也 会 文 持 信和 号 排 
队 。 我 们 将 在 10.20 节 中 进一步 讨论 排队 信号。 

SVR2 的 手册 页 称 ， 在 进程 执行 SIGCLD 信和 号 处 理 程序 期 间 ， 该 信 
号 是 用 排队 方式 处 理 的 ， 虽 然 在 概念 层次 这 可 能 是 真 的 ， 但 实际 并 非 
如 此 。 内 核 是 按照 10.7 下 中 所 述 方 式 产生 此 信号 。SVR3 的 手册 页 对 此 
做 了 修改 ， 它 指明 在 进程 执行 SIGCLD 信 号 处 理 程序 期 间 ， 和 忽略 
SIGCLD 信 号 。SVR4 手 册页 删除 了 有 关 部 分 。 


AT&T[1990e] F fJ SVRA sigaction(2) F At DI ¥K SA. SIGINFO fj i 
( 见 图 10-16) 使 信号 可 靠 地 排队 ， 这 是 不 正确 的 。 表 面 上 内 核 部 分 地 
实现 了 此 功能 ， 但 在 SVR4 中 并 不 起 作用 。 令 人 不 可 思议 的 是 ，SVID 
(System V 接 口 定 义 ) 对 这 种 可 靠 队 列 并 未 做 同样 的 声明 。 
如 果 有 多 个 信号 要 递送 给 一 个 进程 ， 那 将 如 何 呢 ? POSIX. nid 
规定 这 些 信号 的 递送 顺序 。 但 是 POSIX.1 基 础 部 分 建议 : 在 其 他 信和 号 
前 递送 与 进程 当前 状态 有 关 的 信号 ， 如 SIGSEGV 。 
Nr ud 一 个 信号 屏蔽 字 (signal mask) ， 它 规定 了 当前 要 阻 
送 到 该 进程 的 信号 集 。 对 于 每 种 可 能 的 信号 ， 该 屏蔽 字 中 都 有 一 
ice 对 于 某 种 信号 ， 若 其 对 应 位 已 设置 ， 则 它 当 前 是 被 阻塞 
的 。 进 程 可 以 调用 sigprocmask (在 10.12 节 中 说 明 ) 来 检测 和 更 改 其 当 
前 信和 号 屏蔽 字 。 
信号 编号 可 能 会 超过 一 个 整 型 所 包含 的 二 进 制 位 数 ， 因 此 
POSIX.1 定义 了 一 个 新 数据 类 型 sigset_t， 它 可 以 容纳 一 个 信号 集 。 例 
如 ， 信 号 屏蔽 字 就 存放 在 其 中 一 个 信号 集中 。10.11 节 将 说 明 对 信号 集 
进行 操作 的 5 个 函数 。 


10.9 kill4lraise 


kl 芳 数 将 信号 发 送 给 进程 或 进程 组 。raise 函 数 则 人 允许 进程 癌 自 和 喘 
发 送信 号 
raise 最 初 是 由 ISO C 定 义 的 。 后 来 ， 为 了 与 ISO C 标 准 保持 一 致 ， 
POSIX.1 也 包括 了 该 函数 。 但 是 POSIX.1 扩 展 了 raise 的 规范 ， 使 其 可 处 
理 线程 (12.8 中 讨论 线程 如 何 与 信号 交互 ) 。 
因为 I SO C 并 不 涉及 多 进程 ， 所 以 它 不 能 定义 以 进程 ID 作为 其 参数 
(QUIN ZO | 的 函数 。 


#include <signal.h> 
int kill(pid t pid, int signo); 
int raise(int signo); 


AS ERROR: 大 成 功 ， 返 回 0; Ah, wE- 


调用 

raise(signo); 

等 价 于 调用 

kill(getpid(), signo); 

kill 的 pid 参 数 有 以 下 4 种 不 同 的 情况 。 

pid > 0 将 该 信号 发 送 给 进程 ID 为 pid 的 进程 。 

pid == 0 将 该 信号 发 送 给 与 发 送 进程 属于 同一 进程 组 的 所 有 进程 
(这 些 进程 的 进程 组 ID 等 于 发 送 进程 的 进程 组 ID) ， 而 且 发 送 进程 具 
有 权限 向 这 些 进程 发 送信 号 。 这 里 用 的 术语 “所 有 进程 ”不 包括 实现 定 
义 的 系统 进程 集 。 对 于 大 多 数 UNIX 系 统 ， 系 统 进 程 集 包 括 内 核 进 程 和 
init (pid 为 1) ° 

pid < 0 将 该 信号 发 送 给 其 进程 组 ID 等 于 pid 绝 对 值 ， 而 且 发 送 进程 
具有 权限 向 其 发 送信 号 的 所 有 进程 。 如 前 所 述 ， 所 有 进程 并 不 包括 系 
统 进程 集中 的 进程 。 

pid == -1 将 该 信号 发 送 给 发 送 进 程 有 权限 同 它们 发 送信 号 的 所 有 
进程 。 如 前 所 述 ， 所 有 进程 不 包括 系统 进程 集中 的 进程 。 

如 前 所 述 ， 进 程 将 信号 发 送 给 其 他 进程 需要 权限 。 超 级 用 户 可 将 
信号 发 送 给 任 一 进程 。 对 于 非 超级 用 户 ， 其 基本 规则 是 发 送 者 的 实际 
HP ID 或 有 效用 户 ID 必须 等 于 接收 者 的 实际 用 户 ID 或 有 效用 户 ID。 
如 果实 现 支持 _POSIX_SAVED_IDS (如 POSIX.1 现 在 要 求 的 那样 ) ， 则 
检查 接收 者 的 保存 设置 用 户 ID (而 不 是 有 效用 户 ID) 。 在 对 权限 进行 
测试 时 也 有 一 个 特例 : 如 果 被 发 送 的 信号 是 SIGCONT， 则 进程 可 将 它 
发 送 给 属于 同一 会 话 的 任 一 其 他 进程 。 


POSIX.1 将 信号 编号 0 定义 为 空 信 号 。 如 果 signo 参 数 是 0(， 则 kill 仍 
执行 正常 的 错误 检查 ， 但 不 发 送信 号 。 这 党 被 用 来 确定 一 个 特定 进程 
是 否 仍 然 存 在 。 如 果 疝 一 个 并 不 存在 的 进程 发 送 空 信号 ， 则 k 记 返回 
-1，erro 被 设置 为 ESRCH。 但 是 ， 应 当 注 意 ，UNIX 系 统 在 经 过 一 定 
时 间 后 会 重新 使 用 进程 ID， 所 以 一 个 现 有 的 具有 所 给 定 进 程 ID 的 进程 
并 不 一 定 束 是 你 所 想 要 的 进程 。 

还 应 理解 的 是 ， 测 斌 进程 是 否 存在 的 操作 不 是 原子 操作 。 在 kill 向 
调用 者 返回 测试 结果 时 ， 原 来 已 存在 的 被 测试 进程 此 时 可 能 已 经 终 
止 ， 所 以 这 种 测试 并 无 多 大 价值 。 

如 有 果 调 用 kill 为 调用 进程 产生 信号 ， 而 且 此 信和 号 是 不 被 阻塞 的 ， 那 
么 在 kill 返 回 之 前 ， signo 或 者 某 个 其 他 未 决 的 、 非 阻塞 信号 被 传送 至 该 
进程 。〈 对 于 线程 而 言 ， 还 有 一 些 附加 条 件 ， 详 细 情 况 见 12.8 记 。 ) 


10.10 函数 alarm 和 pause 


使 用 alarm 函 数 可 以 设置 一 个 定时 器 ERTE) ， 在 将 来 的 某 个 
时 刻 该 定时 器 会 超时 。 当 定时 器 超时 时 ， 产 生 SIGALRM 信和 号。 如 果 
忽略 或 不 捕捉 此 信号 ， 则 其 默认 动作 是 终止 调用 该 alarm 函 数 的 进程 。 

#include <unistd.h> 

unsigned int alarm(unsigned int seconds); 

返回 值 : OB DA Bt C EAS il BRAY AIR BS A 

参数 seconds 的 值 是 产生 信号 SIGALRM 需 要 经 过 的 时 钟 秒 数 。 当 这 
一 时 刻 到 达 时 ， 信 和 号 由 内 核 产 生 ， 由 于 进程 调度 的 延迟 ， 所 以 进程 得 
到 控制 从 而 能 够 处 理 该 信号 还 需要 一 个 时 间 间 隔 。 

早期 的 UNIX 系 统 实现 曾 提出 警告 ， 这 种 信号 可 能 比 预定 值 提前 1s 
发 送 。POSIX.1 则 不 允许 这 样 做 。 


每 个 进程 只 能 有 一 个 疝 钟 时 间 。 如 采 在 调用 alarm 时 ， 之 前 已 为 该 
进程 注册 的 闹钟 时 间 还 没有 超时 ， 则 该 闹钟 时 间 的 余 留 值 作为 本 次 
alarm 函 数 调 用 的 值 返 回 。 以 前 注册 的 闹钟 时 间 则 被 新 值 代 疹 。 

如 采 有 以 前 注册 的 尚未 超过 的 曾 钟 时 间 ， 而 且 本 次 调用 的 seconds 
值 是 0， 则 取消 以 前 的 曾 钟 时 间 ， 其 余 留 值 仍 作 为 alarm 函 数 的 返回 值 。 

虽然 SIGALRM 的 默认 动作 是 终止 进程 ， 但 是 大 多 数 使 用 立 钟 的 
进程 捕捉 此 信号 。 如 果 此 时 进程 要 终止 ， 则 在 终止 之 前 它 可 以 执行 所 
需 的 清理 操作 。 如 果 我 们 想 捕 捉 SIGALRM 信号 ， 则 必须 在 调用 alarm 
之 前 安装 该 信号 的 处 理 程序 。 如 果 我 们 先 调 用 alarm， 然 后 在 我 们 能 够 
安 狼 SIGALRM 人 处 理 程序 之 前 已 接 到 该 信和 号， 那么 进程 将 终止 。 

pause 芳 数 使 调用 进程 挂 起 直至 捕 提 到 一 个 信号 。 

#include <unistd.h> 

int pause(void); 

返回 值 : -1, ernog E AEINTR 

只 有 执行 了 一 个 信号 处 理 程 序 并 从 其 返回 时 ，pause 才 返回 。 在 这 
种 情况 下 ，pause 返 回 -1， errno 设 置 为 EINTR ° 

实例 

使 用 alarm 和 pause， 进 程 可 使 自己 休眠 一 段 指定 的 时 间 。 图 10-7 中 
的 sleep1 芳 数 看 似 提 供 了 这 种 功能 (其 实 这 里 面 存 在 问题 ， 我 们 很 快 就 
会 看 到 ) » 


#include <signal.h> 
#include <unistd.h> 


static void 
sig_alrm(int signo) 
{ 
/* nothing to do, just return to wake up the pause */ 


} 


unsigned int 
sleepl (unsigned int seconds) 


{ 


if (signal(SIGALRM, sig_alrm) == SIG_ERR) 
return (seconds) ; 
alarm(seconds) ; /* start the timer */ 
pause(); /* next caught signal wakes us up */ 


return (alarm (0)); /* turn off timer, return unslept time */ 


图 10-7 sleep 简 化 而 不 完整 的 实现 


程序 中 的 sleep1 函 数 看 起 来 与 将 在 10.19 市 中 说 明 的 sleep 了 芳 数 类 似 ， 
但 这 种 简单 实现 有 以 下 3 个 问题 。 

(1) 如 果 在 调用 sleep1l 之 前 ， 调 用 者 已 设置 了 闹钟 ， 则 它 被 sleep1 
函数 中 的 第 一 次 alarm 调 用 擦 除 。 可 用 下 列 方法 更 正 这 一 点 检查 第 一 
次 调用 alarm 的 返回 值 ， 如 其 值 小 于 本 次 调用 alarm 的 参数 值 ， 则 只 应 
等 到 已 有 的 闸 钟 超时 。 如 有 果 之 前 设置 的 曾 钟 超时 时 间 晚 于 本 次 设置 
值 ， 则 在 sleep1 芳 数 返 回 之 前 ， 重 置 此 闭 钟 ， 使 其 在 之 前 曾 钟 的 设 定时 
间 再 次 发 生 超时 。 

(2) 该 程序 中 修改 了 对 SIGALRM 的 配置 。 如 果 编 写 了 一 个 函数 
供 其 他 男 数 调 用 ， 则 在 该 函数 被 调用 时 移 要 保存 原配 置 ， 在 该 国 数 返 
回 前 再 恢复 原配 置 。 更 正 这 一 点 的 方法 是 : 保存 signal 函 数 的 返回 值 ， 
在 返回 前 重 置 原配 置 。 

(3) 在 第 一 次 调用 alarm 和 pause 之 间 有 一 个 竞争 条 件 。 在 一 个 繁 
忙 的 系统 中 ， 可 能 alarm 在 调用 pause 之 前 超时 ， 并 调用 了 信号 处 理 程 
序 。 如 有 果 发 生 了 这 种 情况 ， 则 在 调用 pause 后 ， 如 果 没 有 捕捉 到 其 他 信 
号 ， 调 用 者 将 永远 被 挂 起 。 


sleep 的 早期 实现 与 图 10-7 程 序 类 似 ， 但 更 正 了 第 1 个 和 第 2 个 问 
题 。 有 两 种 方法 可 以 更 正 第 3 个 问题 。 第 一 种 方法 是 使 用 setmp， 下 一 
个 实例 将 说 明 这 种 方法 。 另 一 种 方法 是 使 用 sigprocmask 和 sigsuspend , 
10.19 世 将 说 明 这 种 方法 。 

实例 

SVR2 中 的 Sleep 实现 使 用 了 setjimp 和 longjmp ( 见 7.10 节 ) ， 以 避免 
前 一 个 实例 的 第 3 个 问题 中 说 明 的 竞争 条 件 。 此 函数 鸭 一 个 简化 版 本 称 
为 sleep2， 示 于 图 10-8 中 〈 为 了 缩短 实例 程序 的 长 度 ， 程 序 中 没有 处 理 
上 面 所 说 的 第 1 个 和 第 2 个 问题 ) 。 


#include <setjmp.h> 
#include <signal.h> 
#include <unistd.h> 
static jmp_buf env_alrm; 


static void 
sig_alrm(int signo) 
{ 
longjmp(env_alrm, 1); 


} 


unsigned int 
sleep2 (unsigned int seconds) 
{ 
if (signal (SIGALRM, sig alrm) == SIG ERR) 
return (seconds) ; 
if (setjmp(env_alrm) == 0) { 


alarm(seconds) ; /* start the timer */ 
pause (); /* next caught signal wakes us up */ 
} 
return(alarm(0)); /* turn off timer, return unslept time */ 


图 10-8 sleep 的 另 一 个 不 完善 的 实现 

在 此 函数 中 ， 已 避免 了 图 10-7 中 具有 的 竞争 条 件 。 即 使 pause 从 未 
执行 ， 在 发 生 SIGALRMH 时 ，sleep2 画 数 也 返回 。 

但 是 ，sleep2 范 数 中 却 有 男 一 个 难以 察觉 的 问题 ， 它 涉及 与 其 他 信 
号 的 交互 。 如 果 SIGALRM 中 断 了 某 个 其 他 信号 处 理 程 序 ， 则 调用 
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处 理 程 序 中 包含 了 for 循环 语句 ， 它 在 作者 所 用 系统 上 的 执行 时 间 超 过 
5s， 也 就 是 大 于 sleep2 的 参数 值 ， 这 正 是 我 们 想 要 的 。 整 型 变量 k 说 明 
为 volatile， 这 样 就 阻止 了 优化 编译 程序 去 除 循环 语句 。 


#include "apue.h" 


unsigned int sleep2 (unsigned int); 
static void Sig int (Ine) 


int 
main (void) 
{ 


unsigned int unslept; 


if (signal(SIGINT, sig_int) == SIG_ERR) 
err_sys("signal(SIGINT) error"); 
unslept = sleep2 (5); 
printf ("sleep2 returned: %u\n", unslept); 
exit (0); 
} 


static void 
sig_int(int signo) 


{ 


int iy WV 
volatile int k; 
/* 


* Tune these loops to run for more than 5 seconds 

* on whatever system this test program is run. 

E 
printf("Mnsig int starting\n"); 

for (i = 0; i « 300000; i++) 

for (j = 0; < 4000; j++) 
k mud; 
printf ("sig_int finished\n"); 


予 中 调用 sleep2 


— 


图 10-9 在 一 个 捕 提 其 他 信号 的 程 
执行 图 10-9 中 的 程序 ， 可 以 通过 键入 中 断 字 符 来 中 断 休 眠 ， 运 行 结 
RU F: 


$ /a.out 


^C BEA FRUTA TT 

sig int starting 

sleep2 returned: 0 

MP up Dl sleep2 ER Zi Pr 5 | LE Alongimp (5 — “Ms 5 4E ERE FFsig. int 
EFIE, BVH ATER UE  WIRTESVR2HsleepER 2x HtA 
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sleep1 和 sleep2 函数 的 这 两 个 实例 是 告诉 我 们 在 涉及 信号 时 需要 有 
精细 而 周到 的 考虑 。 下 面 几 和 将 说 明 解 决 这 些 问 题 的 方法 ， 使 我 们 能 
够 可 徘 地 、 在 不 影响 其 他 代码 段 的 情况 下 处 理 信 号 。 

实例 

除了 用 来 实现 sleep 芳 数 外 ，alarm 还 常用 于 对 可 能 阻 塞 的 探 作 设置 
时 间 上 限 值 。 例 如 ， 程 序 中 有 一 个 读 低速 设备 的 可 能 阻塞 的 操作 (UU 
10.5 77) ， 我 们 和 希望 超过 一 定时 间 量 后 就 停止 执行 该 操作 。 图 10-10 实 
现 了 这 一 点 ， 它 从 标准 输入 读 一 行 ， 然 后 将 其 写 到 标准 输出 上 。 


char line[MAXLINE]; 


if (signal(SIGALRM, sig alrm) -- SIG ERR) 
err sys("signal(SIGALRM) error"); 


alarm(10); 
if ((n = read(STDIN FILENO, line, MAXLINE)) « 0) 
err sys("read error"); 


alarm(0); 


write(STDOUT FILENO, line, n); 
exit(0); 
} 


static void 
sig_alrm(int signo) 
{ 
/* nothing to do, just return to interrupt the read */ 


} 


图 10-10 带 时 间 限 制 调 用 read 


这 种 代码 序列 在 很 多 UNIX 应 用 程序 中 都 能 见 到 ， 但 是 这 种 程序 有 
两 个 问题 : 

(1) 图 10-10 中 的 程序 具有 与 图 10-7 中 的 程序 相同 的 问题 : 在 第 
一 次 alarm 调用 和 read 调 用 之 间 有 一 个 竞争 条 件 。 如 果 内 核 在 这 两 个 函 
数 调用 之 间 使 进程 阻塞 ， 不 能 占用 处 理 机 运行 ， 而 其 时 间 长 度 又 超过 
闸 钟 时 间 ， 则 read 可 能 永远 阻塞 。 大 多 数 这 种 类 型 的 操作 使 用 较 长 的 六 
钟 时 间 ， 例 如 1 分 钟 或 更 长 一 点 ， 使 这 种 问题 不 会 发 生 ， 但 无 论 如 何 这 
是 一 个 竞争 条 件 。 

(2) 如 果 系 统 调用 是 自动 重启 动 的 ， 则 当 从 SIGALRM 信 和 号 处 理 
程序 返回 时 ，read 并 不 被 中 断 。 在 这 种 情形 下 ， 设 置 时 间 限 制 不 起 作 
用 o 

在 这 里 我 们 确实 需要 中 断 慢 速 系统 调用 。 我 们 将 在 10.14 节 对 此 进 
行 详细 讨论 。 

实例 

让 我 们 用 longjmp 再 实现 前 面 的 实例 。 使 用 这 种 方法 无 需 担心 一 个 
慢 速 的 系统 调用 是 否 被 中 断 ， 见 图 10-11 。 


#include "apue.h" 
#include <setjmp.h> 


static void sig alrm(int); 
static jmp buf env alrm; 
int 


main (void) 


{ 


int n; 
char line [MAXLINE]; 
if (signal(SIGALRM, sig_alrm) == SIG_ERR) 


err sys("signal(SIGALRM) error"); 
if (setjmp(env alrm) != 0) 
err quit("read timeout"); 


alarm(10); 
if ((n = read(STDIN FILENO, line, MAXLINE)) « 0) 


err sys("read error"); 


alarm(0); 


write(STDOUT FILENO, line, n); 
exit(0); 
} 


static void 
sig_alrm(int signo) 
{ 
longjmp(env_alrm, 1); 


} 


图 10-11 使 用 longjmp， 带 时 间 限 制 调用 read 

不 管 系统 是 否 重新 启动 被 中 断 的 系统 调用 ， 该 程序 都 会 如 所 预期 
的 那样 工作 。 但 是 要 知道 ， 该 程序 仍旧 有 和 图 10-8 中 的 程序 相同 的 与 其 
他 信号 处 理 程序 交互 的 问题 。 

如 有 果 要 对 1O 操 作 设 置 时 间 限 制 ， 则 如 上 所 示 可 以 使 用 longjmp， 当 
然 也 要 清楚 它 可 能 有 与 其 他 信和 号 处 理 程序 交互 的 问题 。 另 一 种 选择 是 
使 用 select 或 poll 函 数 ，14.4.1 节 和 14.4.2 节 将 对 它们 进行 说 明 。 


10.11 信和 号 集 


我 们 需要 有 一 个 能 表示 多 个 信号 一 一 信号 集 (signal set) 的 数据 类 
型 。 我 们 将 在 sigprocmask (下 一 节 中 说 明 ) 类 函数 中 使 用 这 种 数据 类 
型 ， 以 便 告 诉 内 核 不 允许 发 生 该 信号 集中 的 信号 。 如 前 所 述 ， 不 同 的 
言 号 的 编号 可 能 超过 一 个 整 型 量 所 包含 的 位 数 ， 所 以 一 般 而 言 ， 不 能 
用 整 型 量 中 的 一 位 代表 一 种 信号 ， 也 就 是 不 能 用 一 个 整 型 量 表示 信号 
集 。POSIX.1 定 义 数 据 类 型 sigset_t 以 包含 一 个 信号 集 ， 并 且 定 义 了 下 列 
5 个 处 理 信号 集 的 函数 。 


#include <signal.h> 


int sigemptyset(sigset_t *set); 

int sigfillset(sigset_t *set); 

int sigaddset(sigset_t *set, int signo); 

int sigdelset(sigset_t *set, int signo); 

4 个 函数 返回 值 ， 奉 成 功 ， 返 回 0;， 大 出错， 返回 -1 
int sigismember(const sigset_t *set, int signo); 

Ex X sigemptyset?] fat EH setfR ANS, PRE HP PUB fei o 
Ex sigfillset] ink setae se, HATE ALES o MAMA 
程序 在 使 用 信号 集 前 ， 要 对 该 信号 集 调用 sigemptyset 或 sigfillset 一 次 。 
这 是 因为 C 编 译 程序 将 不 赋 初 值 的 外 部 变量 和 静态 变量 都 初始 化 为 0， 
而 这 是 否 与 给 定 系 统 上 信和 号 集 的 实现 相对 应 却 并 不 清楚 。 

一 旦 已 经 初始 化 了 一 个 信号 集 ， 以 后 束 可 在 该 信号 集中 增 、 删 特 
定 的 信号。 函数 sigaddset 将 一 个 信和 号 添加 a 到 已 有 的 信号 集中 ，sigdelset 
则 从 信和 号 集中 删除 一 个 信号 。 对 所 有 以 信和 号 集 作 为 参数 的 函数 ， 总 是 
以 信号 集 地 址 作为 癌 其 传送 的 参数 。 

实现 

如 采 实 现 的 信号 数目 少 于 一 个 整 型 量 所 包含 的 位 数 ， 则 可 用 一 位 
代表 一 个 信和 号 的 方法 实现 信号 集 。 例 如 ， 本 书 的 后 续 部 分 都 假定 一 种 
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<signal.h> 头 文件 中 实现 为 安 : 

#define sigemptyset(ptr) (*(ptr) = 0) 

#define sigfillset(ptr) (*(ptr) = ^(sigset t)O, 0) 

注意 ， 除 了 设置 信号 集中 各 位 为 1 外 ，sigfillset 必 须 返 回 0， 所 以 使 
用 C 语 言 的 逗号 算 符 ， 它 将 去 号 算 符 后 的 值 作 为 表达 式 的 值 返 回 。 

使 用 这 种 实现 ，sigaddset 开启 一 位 (将 该 位 设置 为 1) , sigdelset 
则 关闭 一 位 〈 将 该 位 设置 为 0) ; sigismember 测 试 一 个 指定 的 位 。 因 为 
没有 信号 编号 为 0， 所 以 从 信号 编号 中 减 1 以 得 到 要 处 理 位 的 位 编号 
数 。 图 10-12 给 出 了 这 些 画 数 的 实现 。 


#include <signal.h> 


#include <errno.h> 

/* 

* <signal.h> usually defines NSIG to include signal number 0. 
d. 

#define SIGBAD(signo) ((signo) <= 0 || (signo) >= NSIG) 

int 


sigaddset (sigset_t *set, int signo) 
{ 
if (SIGBAD(signo)) { 
errno = EINVAL; 
return (-1); 
} 
*set |= 1 << (signo - 1); /* turn bit on */ 


return (0); 


int 
sigdelset(sigset t *set, int signo) 
( 
if (SIGBAD(signo)) { 
errno - EINVAL; 
return(-1); 
} 
*set &= ~(1 << (signo = 1)); /* Cen DLE ofl */ 
return (0); 


int 
sigismember (const sigset t *set, int signo) 
( 
if (SIGBAD(signo)) { 
errno - EINVAL; 


return(-1); 
} 


return((*set & (1 << (signo - 1))) != 0); 


图 10-12 sigaddset、sigdelset 和 sigismember 的 实现 


也 可 将 这 3 个 函数 在 <signal.h> 中 实现 为 各 一 行 的 宏 ， 但 是 POSIX.1 
要 求 检 查 信 号 编号 参数 的 有 效 性 ， 如 果 无 效 则 设置 errno。 在 宏 中 实现 
这 一 点 比 函 数 要 难 。 


10.12 函数 sigprocmask 


10.8 世 曾 握 及 一 个 进程 的 信号 屏蔽 字 规 定 了 当前 阻塞 而 不 能 递送 给 
该 进程 的 信号 集 。 调 用 函数 sigprocmask 可 以 检测 或 更 改 ， 或 同时 进行 
FEAH DCHERRB aS BRC © 


#include <signal.h> 


int sigprocmask(int how, const sigset_t *restrict set, sigset_t *restrict 
oset); 
返回 值 : By, iR[BO; ete, wel- 
Bt, FoseersFaistl, HAGENS BIS Ss FF a He osetikx 
[n] o 
其 次 ， 大 set 是 一 个 非 空 指针 ， 则 参数 how 指 示 如 何 修改 当前 信和 号 屏 
向 字 。 图 10-13 说 明了 how 可 选 的 值 。SIG_BLOCK 十 或 操作 ， 而 
SIG_SETMASK 则 是 赋值 操作 。 注 意 ， 不 能 阻塞 SIGKILL 和 SIGSTOP 信 


r1 


meg 9 


how 说 明 


SIG_BLOCK 该 进程 新 的 信号 屏蔽 字 是 其 当前 信号 屏蔽 字 和 set 指向 信号 集 的 并 集 。set 包含 了 希 
望 阻 塞 的 附加 信和 号 


SIG_UNBLOCK 该 进程 新 的 信号 屏蔽 字 是 其 当前 信号 屏蔽 字 和 set 所 指向 信号 集 补 集 的 交集 。set tu 
含 了 和 希望 解除 阻塞 的 信号 
SIG SETMASK 该 进程 新 的 信和 号 屏蔽 是 set 指向 的 值 


图 10-13 用 sigprocmask 更 改 当前 信号 屏蔽 字 的 方法 
如 果 set 是 个 空 指针 ， 则 不 改变 该 进程 的 信号 屏蔽 了 字 ，how 的 值 也 无 


在 调用 sigprocmask 后 如 果 有 任何 未 决 的 、 不 再 阻截 的 信和 号 ， 则 在 
sigprocmask 返 回 前 ， 人 至 少将 其 中 之 一 递送 给 该 进程 。 

sigprocmask 是 仅 为 单线 程 进程 定义 的 。 处 理 多 线程 进程 中 信和 号 的 
屏蔽 使 用 男 一 个 函数 。 我 们 将 在 12.8 方 中 对 此 进行 讨论 。 


实例 
图 10-14 程 序 是 一 个 函数 ， 它 打印 调用 进程 信号 屏蔽 字 中 的 信号 
名 。 图 10-20 中 的 程序 和 图 10-22 中 的 程序 将 调用 此 函数 。 


#include "apue.h" 
#include <errno.h> 


void 
pr mask(const char *str) 


sigset t sigset; 
int errno save; 


errno save - errno; /* we can be called by signal handlers */ 
if (sigprocmask(0, NULL, &sigset) « 0) ( 
err ret("sigprocmask error"); 
) else ( 
printf("*s", Ste); 
if (sigismember(&sigset, SIGINT)) 
printf(" SIGINT"); 
if (sigismember(&sigset, SIGQUIT)) 
printf(" SIGQUIT"); 
if (sigismember(&sigset, SIGUSR1) ) 
printf(" SIGUSR1"); 
if (sigismember(&sigset, SIGALRM)) 
printf(" SIGALRM"); 


/* remaining signals can go here */ 


printf ("Xn") 
} 


errno = errno_save; /* restore errno */ 


图 10-14 为 进程 打印 信号 屏蔽 字 


为 了 市 省 空间 ， 没 有 对 图 10-1 中 列 出 的 每 一 种 信和 号 测试 该 屏 菩 字 
(见习 题 10.9) ° 


10.13 图 数 sigpending 


sigpending 函 数 返 回 一 信号 集 ， 对 于 调用 进程 而 言 ， 其 中 的 各 信和 号 
是 阻塞 不 能 递送 的 ， 因 而 也 一 定 是 当前 未 决 的 。 该 信号 集 通过 set 参 数 
jk [RH] » 

#include <signal.h> 

int sigpending(sigset_t *set); 


返回 值 : ERD, RIO; AE, we- 


实例 
图 10-15 展 示 了 很 多 前 面 说 明 过 的 信和 号 功能 


#include "apue.h" 

static void sig quit(int); 
int 

main (void) 

{ 


sigset t newmask, oldmask, pendmask; 


if (signal(SIGQUIT, sig quit) -- SIG ERR) 


err sys("can't catch SIGQUIT"); 


/* 
* Block SIGQUIT and save current signal mask. 
xy 
sigemptyset (&newmask) ; 
Sigaddset (&newmask, SIGQUIT); 
if (sigprocmask(SIG_BLOCK, &newmask, &oldmask) < 0) 
err_sys("SIG_ BLOCK error"); 


sleep (5); /* SIGQUIT here will remain pending */ 


if (sigpending(&pendmask) < 0) 
err sys("sigpending error"); 

if (sigismember(&pendmask, SIGQUIT)) 
printf ("\nSIGQUIT pending ^n"); 


/* 
* Restore signal mask which unblocks SIGQUIT. 
Ef 
if (sigprocmask(SIG SETMASK, &oldmask, NULL) < 0) 
err sys("SIG SETMASK error"); 
printf("SIGQUIT unblocked\n") 


sleep(5); /* SIGQUIT here will terminate with core file */ 
exit (0); 
) 


static void 
sig quit(int signo) 
( 
printf ("caught SIGQUIT Mn") 
if (signal(SIGQUIT, SIG DFL) -- SIG ERR) 
err sys("can't reset SIGQUIT"); 


图 10-15 信号 设置 和 sigprocmask 实 例 


进程 阻塞 SIGQUIT 信 号 ， 保 存 了 当前 信号 屏蔽 字 〈 以 便 以 后 恢 
复 ) ， 然 后 休 眼 5 秒 。 在 此 期 间 所 产生 的 退出 信号 SIGQUIT 都 被 阻塞 ， 
不 递送 至 该 进程 ， 直 到 该 信号 不 再 被 阻塞 。 在 5 秒 休眠 结束 后 ， 检 查 该 
信号 是 否 是 未 决 的 ， 然 后 将 SIGQUIT 设 置 为 不 再 阻塞 。 

注意 ， 在 设置 SIGQUIT 为 阻塞 时 ， 我 们 保存 了 老 的 屏蔽 字 。 为 了 
解除 对 该 信号 的 阻塞 ， 用 老 的 屏蔽 字 重 新 设置 了 进程 信号 屏蔽 字 

(SIG SETMASK) 。 男 一 种 方法 是 用 SIG_UNBLOCK 使 阻塞 的 信号 不 
再 阻塞 。 但 是 ， 应 当 了 解 如 果 编 写 一 个 可 能 由 其 他 人 使 用 的 函数 ， 而 


且 需 要 在 函数 中 阻塞 一 个 信号 ， 则 不 能 用 SIG_UNBLOCK 简 单 地 解除 
对 此 信号 的 阻塞 ， 这 是 因为 此 函数 的 调用 者 在 调用 本 函数 之 前 可 能 
阻 赛 了 此 信号 。 在 这 种 情况 下 必须 使 用 SIG_SETMASK 将 信号 屏蔽 字 恢 
复 为 先前 的 值 ， 这 样 也 就 能 继续 阻塞 该 信号 。10.18 节 的 system 画 数 部 
分 有 这 样 的 一 个 例子 。 

在 休眠 期 间 如 果 产 生 了 退出 信和 号， 那么 此 时 该 信号 是 未 决 的， 但 
是 不 再 受阻 塞 ， 所 以 在 sigprocmask 返回 之 前 ， 它 被 递送 到 调用 进程 。 
从 程序 的 输出 中 可 以 看 到 这 一 点 : SIGQUIT 处 理 程序 (sig_quit) 中 的 
printf 语 句 先 执 行 ， 然 后 再 执行 sigprocmask 之 后 的 printf 语 句 。 

然后 该 进程 再 休眠 5 秒 。 如 果 在 此 期 间 再 产生 退出 信号 ， 那 么 因为 
在 上 次 捕捉 到 该 信号 时 ， 已 将 其 处 理 方式 设置 为 默认 动作 ， 所 以 这 一 
次 它 就 会 使 该 进程 终止 。 在 下 列 输出 中 ， 当 我 们 在 终端 键入 退出 字符 
Ctrl+\ 时 ， 终 端 打 印信 (终端 退出 字符 ) : 


$ ./a.out 

^ 产生 信号 一 次 (在 5s 之 内 ) 
SIGQUIT pending 从 sleep 返 回 后 
caught SIGQUIT 在 信号 处 理 程序 中 
SIGQUIT unblocked 从 sigprocmask 返 回 后 
^Quit(coredump) 再 次 产生 信和 号 

$ ./a.out 

AWWAWWWWWWA 产生 信号 10 次 (在 5 s 之 内 ) 
SIGQUIT pending 

caught SIGQUIT 只 产生 信和 号 一 次 
SIGQUIT unblocked 

^Quit(coredump) 再 产生 信和 号 


shell 发 现 其 子 进 程 异 常 终止 时 输出 QUIT(coredump) 信 息 。 注 意 ， 
第 二 次 运行 该 程序 时 ， 在 进程 休眠 期 间 使 SIGQUIT 信 号 产生 了 10 次 ， 


但 是 解除 了 对 该 信号 的 阻塞 后 ， 只 同 进程 传送 一 次 SIGQUIT。 从 中 可 
以 看 出 在 此 系统 上 没有 将 信号 进行 排队 。 


10.14 图 数 sigaction 


sigaction 函 数 的 功能 是 检查 或 修改 (或 检查 并 修改 ) 与 指定 信号 相 
关联 的 处 理 动作 。 此 函数 取代 了 UNIX 早 期 版 本 使 用 的 signal 函 数 。 在 
本 节 末 尾 用 sigaction 画 数 实现 了 signal。 


#include <signal.h> 


int sigaction(int signo, const struct sigaction *restrict act, 
struct sigaction *restrict oact); 
返回 值 : Aa, welo EE, ge- 

其 中 ， 参 数 signo 是 要 检测 或 修改 其 具体 动作 的 信号 编号 。 帮 act 指 
针 非 空 ， 则 要 修改 其 动作 。 如 果 oact 指 针 非 空 ， 则 系统 经 由 oact 指 针 返 
回 该 信号 的 上 一 个 动作 。 此 函数 使 用 下 列 结构 : 

struct sigaction { 

void (*sa_handler)(int); /* addr of signal handler, */ 
/* or SIG IGN, or SIG. DFL */ 


sigset t sa mask; /* additional signals to block */ 
int sa flags; /* signal options, Figure 10.16 */ 
/* alternate handler */ 
void (*sa_sigaction)(int, siginfo t *, void *); 

}; 


当 更 改 信号 动作 时 ， 如 果 sa_handler 字段 包含 HC BP ERA 
地 址 〈 不 是 常量 SIG_IGN 或 SIG_DFL) , ee ie 
号 集 ， 在 调用 该 信号 捕捉 函数 之 前 ， 这 一 信号 集 要 加 到 进程 的 信和 号 屏 


WE DOS NES S ER GR [UST EA 5 BE CE REAR 
先 值 。 这 样 ， 在 调用 信和 号 处 理 程序 时 就 能 阻塞 某 些 信号 。 在 信号 处 理 
程序 被 调用 时 ， 操 作 系 统 建立 的 新 信号 屏蔽 字 包 括 正 被 递送 的 信和 号。 
因此 保证 了 在 处 理 一 个 给 定 的 信号 时 ， 如 果 这 种 信号 再 次 发 生 ， 那 么 
它 会 被 阻塞 到 对 前 一 个 信号 的 处 理 结束 为 止 。 回 忆 10.8 节 ， 若 同一 种 信 
号 多 次 发 生 ， 通 常 并 不 将 它们 加 入 队列 ， 所 以 如 果 在 某 种 信号 被 阻塞 
时 ， 它 发 生 了 5 次 ， 那 么 对 这 种 信号 解除 阻塞 后 ， 其 信号 处 理 函 数 通常 
只 会 被 调用 一 次 (上 一 个 例子 已 经 说 明了 这 种 特性 ) 。 

一 旦 对 给 定 的 信号 设置 了 一 个 动作 ， 那 么 在 调用 sigaction 显 式 地 改 
变 它 之 前 ， 该 设置 就 一 直 有 效 。 这 种 处 理 方式 与 早期 的 不 可 靠 信 号 机 
制 不 同 ， 符 合 POSIX.1 在 这 方面 的 要 求 。 

act 结 构 的 sa_flags 字 段 指定 对 信和 号 进行 处 理 的 各 个 选项 。 图 10-16 详 
细 列 出 了 这 些 选 项 的 意义 。 若 该 标志 已 定义 在 基本 POSIX.1 标准 中 ， 
那么 SUS JE": 寿 该 标志 定义 在 基本 POSIX.1 标 准 的 XSI 扩 展 中 ， 
那么 该 列 包 仿 “XSI”。 


| sa INTERRUPT | | 


SA NOCLDSTOP 


SA NOCLDWAIT 


SA NODEFER 


SA ONSTACK 


SA RESETHAND 


SA RESTART 


SA SIGINFO 


B x Linux Mac OS xa 说 明 
32.0 X 10.6.8 


| 由 此 信号 中 断 的 系统 调用 不 自动 重启 | 言 号 中 断 的 系统 调用 不 自动 重启 
动 (XSI 对 于 sigaction 的 默认 处 理 方 
st). FER 10.5 45 

43 signo 是 SIGCHLD, 当 子 进程 停止 ( 作 
业 控 制 )， se mea 。 当 子 进程 终止 
时 ， 仍 旧 产 号 (但 请 参阅 下 面 说 
明 的 D 选项 )。 若 已 设置 
此 标志 ， 则 当 停 止 的 进程 继续 运行 时 ， 
作为 XSI 扩 展 ， 不 产生 SIGCHLD 信号 

若 signo 是 SIGCHLD， 则 当 调 用 进程 
的 子 进程 终止 时 ， 不 创建 僵 死 进程 。 若 
调用 进程 随后 调用 wait， 则 阻塞 到 它 所 
有 子 进 程 都 终止 ， 此 时 返回 -1，erzno 
设置 为 BCHILD ( 见 10.7 节 ) 

当 捕捉 到 此 信号 时 ， 在 执行 其 信号 捕 
提 函 数 时 ， 系 统 不 自动 阻塞 此 信号 〈 除 
非 sa mask 包括 了 此 信号 )。 注 意 ， 此 
种 类 型 的 操作 对 应 iie gg 号 

若 用 sigaltstack(2) 已 声明 了 一 
替换 栈 ， 则 此 信和 号 递送 给 蔡 换 栈 - ae 

在 此 信号 捕捉 函数 的 入 口 处 ， 将 此 信和 号 
的 处 理 方式 重 置 为 SIG_DFL， 并 清除 
SA. SIGINFO 标志 。 注 意 ， 此 种 类 型 的 信 

号 对 应 于 早期 的 不 可 靠 信 号 。 但 是 ， 不 能 
自动 重 置 SIGILL 和 SIGTRAP 这 两 个 信 
号 的 配置 。 设 置 此 标志 使 sigaction 的 
行为 如 同 设置 了 SA NODEFER 标志 

由 此 信号 中 断 的 系统 调用 自动 重启 动 
(参见 10.5 节 ) 

此 选项 对 信号 处 理 程序 提供 了 附加 信 
Al: 一 个 指向 siginfo 结构 的 指针 以 及 
一 个 指向 进程 上 下 文 标识 符 的 指针 


图 10-16 处 理 每 个 信号 的 可 选 标志 (sa flags) 


sa_sigaction 字 段 是 一 个 替代 的 信号 处 理 程序 ， 在 sigaction 结 构 中 使 
用 了 SA_SIGINFO 标 志 时 ， 使 用 该 信号 处 理 程序 。 对 于 sa_sigaction 字 段 


和 sa_handler 字 段 两 者 ， 实 现 可 能 使 用 同一 存储 区 ， 所 以 应 用 只 能 


使 用 这 两 个 字段 中 的 一 个 。 


通常 ， 按 下 列 方 式 调 用 信和 号 处 理 程序 : 


void handler(int signo); 


一 次 


但 是 ， 如 果 设 置 了 SA_SIGINFO 标 志 ， 那 么 按 下 列 方式 调用 信和 号 处 
理 程序 : 

void handler(int signo, siginfo t *info, void *context); 

siginfoZif4 E TST ERAN BAIR o ZAM ABS 
下 所 示 。 符 合 POSIX.1 的 所 有 实现 必须 至 少 包 括 si_signo 和 si_code 成 
员 。 另 外 ， 符 合 XSI 的 实现 至 少 应 包含 下 列 字 段 : 


struct Siginfo { 


int si signo; /* signal number */ 

int si errno; /* if nonzero, errno value from <errno.h> 
a 

int si code;  /* additional info (depends on signal) */ 

pid t si pid; /* sending process ID */ 

uid t si uid; /* sending process real user ID */ 

void *sj addr; /* address that caused the fault */ 

int si status; /* exit value or signal number */ 


union sigval si. value; /* application-specific value */ 
/* possibly other fields also */ 
H 
sisval EKG ALE PIE E: 
int sival_int; 
void *sival_ptr; 
应 用 程序 在 递送 信号 时 ， 在 Si_value.sival_int 中 传递 一 个 整 型 数 或 
考 在 si_value.sival_ptr 中 传递 一 个 指针 值 。 
图 10-17 示 出 了 对 于 各 种 信号 的 Si_code 值 ， 这 些 信 号 是 由 Single 
UNIX Specification 定 义 的 。 注 意 ， 实 现 可 定义 附加 的 代码 值 。 
la SÆSIGCHLD, Jl fi Esi pid ^ si statusfllsi uid*E Ex » zzi 
号 是 SIGBUS、SIGILL、SIGFPE 或 SIGSEGV， 则 si_addr 包 含 造 成 故障 


的 根源 地 址 ， 该 地 址 可 能 并 不 准确 。si_errno 字 上 段 包 伟 错 误 编 号， 它 对 
应 于 造成 信号 产生 的 条 件 ， 并 由 实现 定义 。 

言 号 处 理 程序 的 context 参 数 是 无 类 型 指针 ， 它 可 被 强制 类 型 转换 
为 ucontext_t 结 构 类 型 ， 该 结构 标识 信号 传递 时 进程 的 上 下 文 。 该 结构 
至 少 包 仿 下 列 字 上 段 : 


ucontext t *uc link; /* pointer to context resumed when */ 
sigset t uc sigmask; /* signals blocked when this context */ 
stack t uc stack; /* stack used by this context */ 


/* this context returns */ 
/* js active */ 
mcontext t uc mcontext; /* machine-specific representation of */ 


/* saved context */ 


uc_stack 字 段 摘 述 了 当前 上 下 文 使 用 的 栈 ， 至 少 包括 下 列 成 员 : 


void  *ss sp; /* stack base or pointer */ 
size tss size; /* stack size */ 
int ss flags; /* flags */ 


当 实 现 支 持 实 时 信号 扩展 时 ， 用 SA_SIGINFO 标 志 建 立 的 信号 处 理 
程序 将 造成 信号 可 靠 地 排队 。 一 些 保留 信号 可 由 实时 应 用 使 用 。 如 果 
信号 由 sigqueue 函 数 产 生 ， 那 么 siginfo 结 构 能 包含 应 用 特有 的 数据 CE 
见 10.20 节 ) 。 

Xø: signali 

M HisigactionSzXlllsignal HAN ° (RAF A AENA (POSIX.1 
的 基础 阐述 部 分 也 说 明 这 是 POSIX 所 希望 的 ) 。 男 一 方面 ， 有 些 系统 
文 持 老 的 不 可 靠 信 号 语义 signal 函 数 ， 其 目的 是 实现 二 进 制 癌 后 兼容 。 
除非 特殊 地 要 求 老 的 不 可 靠 语义 〈 为 了 向 后 兼容 ) ， 否 则 应 当 使 用 下 
面 的 signal 实现 ， 或 者 直接 调用 sigaction (可 以 在 调用 sigaction 时 指定 


SA_RESETHAND 和 SA_NODEFER 选 项 以 实现 老 语义 的 signal 函 数 ) 。 
本 书 中 所 有 调用 signal 的 实例 均 调用 图 10-18 中 实现 的 范 数 。 


SIGILL 


SIGFPE 


SEGV MAPERR 
SIGSEGV 
SEGV ACCERR 


SIGBUS 


TRAP BRKPT 
SIGTRAP 
TRAP TRACE 


SIGCHLD 


ILL ILLOPC 
ILL ILLOPN 
ILL ILLADR 
ILL ILLTRP 
ILL PRVOPC 
ILL PRVREG 
ILL COPROC 
ILL BADSTK 
FPE INTDIV 
FPE INTOVF 
FPE FLTDIV 
FPE FLTOVF 
FPE FLTUND 
FPE FLTRES 
FPE FLTINV 
FPE FLTSUB 


BUS ADRALN 


BUS ADRERR 


BUS OBJERR 


CLD EXITED 
CLD KILLED 
CLD DUMPED 
CLD TRAPPED 
CLD STOPPED 


CLD CONTINUED 


SI USER 
SI QUEUE 


非法 操作 码 

非法 操作 数 
非法 地 址 模式 

非法 陷入 

特权 操作 码 

协 处 理 器 出 错 
内 部 栈 出 错 

整数 除 以 0 

NEG H 

浮 点 除 以 0 

浮 点 向 上 溢出 

浮 点 向 下 游 出 

浮 点 不 精确 结果 

无 效 浮 点 操作 

下 标 超 出 范围 

地 址 不 映射 至 对 象 

对 于 映射 对 象 的 无 效 权 限 
无 效 地 址 对 齐 

不 存在 的 物理 地 址 

对 象 特定 硬件 错 
进程 断 点 陷入 

进程 跟踪 陷入 

子 进程 已 终止 

子 进程 已 异常 终止 (无 core) 
子 进程 已 异常 终止 (有 core) 
被 跟踪 子 进程 已 陷入 

子 进程 已 停止 
停止 的 子 进 程 已 继续 
kill 发 送 的 信号 
sigqueue 发 送 的 信和 号 


timer settime 设置 的 定时 器 超时 (实时 扩展 ) 
异步 VO 请 求 完成 (实时 扩展 ) 
-条 消息 到 达 消 息 队 列 《 实 时 扩展 ) 


SI TIMER 
SI ASYNCIO 
SI MESGQ 


图 10-17 siginfo_t 代 码 值 
#include "apue.h" 


/* Reliable version of signal(), using POSIX sigaction(). */ 
Sigfunc * 

signal(int signo, Sigfunc *func) 

( 


struct sigaction act, oact; 


act.sa_handler = func; 
sigemptyset (&act.sa_mask) ; 
act.sa_flags = 0; 


if (signo == SIGALRM) { 
#ifdef | SA INTERRUPT 
act.sa_flags |= SA_INTERRUPT; 
#endif 
} else { 
act.sa_flags |= SA_RESTART; 


} 

if (sigaction(signo, &act, &oact) < 0) 
return(SIG ERR); 

return(oact.sa handler); 


图 10-18 用 sigaction 实 现 的 signal 函 数 

注意 ， 必 须 用 sigemptyset 函 数 初始 化 act 结 构 的 sa_mask 成 员 。 不 能 
保证 act.sa_mask=0 会 做 同样 的 事情 。 

对 除 SIGALRM 以 外 的 所 有 信号 ， 我们 都 有 意 党 试 设置 
SA_RESTART 标 志 ， 于 是 被 这 些 信号 中 断 的 系统 调用 都 能 自动 重启 
动 。 不 希望 重启 动 由 SIGALRM 信号 中 断 的 系统 调用 的 原因 是 : 我 们 
希望 对 1/O 操 作 可 以 设置 时 间 限 制 (请 回忆 有 关 图 10-10 的 讨论 ) 。 

某 些 早期 系统 (如 SunOS) 定义 了 SA_INTERRUPT 标 志 。 这 些 系 
统 的 默认 方式 是 重新 启动 被 中 断 的 系统 调用 ， 而 指定 此 标志 则 使 系统 
调用 被 中 断后 不 再 重启 动 。Linux 定 义 SA_INTERRUPT 标 志 ， 以 便 与 使 
用 该 标志 的 应 用 程序 兼容 。 但 是 ， 如 若 信和 号 处 理 程 序 是 用 sigaction 设 置 
的 ， 那 么 其 默认 方式 是 不 重新 局 动 系统 调用 。Single UNIX Specification 
的 XSI 扩 展 规定 ， 除 非 说 明了 SA_RESTART 标 志 ， 和 否则 sigaction 函 数 不 
再 重 局 动 被 中 断 的 系统 调用 。 


实例 : signal_intr 函 数 
图 10-19 给 出 的 是 signal 函 数 的 另 一 种 版 本 ， 它 力图 阻止 被 中 断 的 系 
统 调 用 重 局 动 。 


#include "apue.h" 


Sigfunc * 
signal intr(int signo, Sigfunc *func) 
{ 


struct sigaction act, oact; 


act.sa_handler = func; 
sigemptyset (&act.sa_mask) ; 
act.sa_flags = 0; 

#ifdef SA_INTERRUPT 
ct.sa_flags |= SA_INTERRUPT; 

#endif 
if (sigaction(signo, &act, &oact) < 0) 

return (SIG_ERR) ; 

return(oact.sa_handler); 


图 10-19 signal_intr 函 数 


如 果 系 统 定义 了 SA_INTERRUPT 标 志 ， 那 么 为 了 提高 可 移植 性 ， 
我 们 在 sa_flags 中 增加 该 标志 ， 这 样 也 就 阻止 了 被 中 断 的 系统 调用 的 重 
启动 。 


10.15 函数 sigsetjmp 和 siglongjmp 


7.40 市 说 明了 用 于 非 局 部 转移 的 setjmp 和 longjmp 函数 。 在 信和 号 
处 理 程序 中 经 常 调用 longjmp 范 数 以 返回 到 程序 的 主 循环 中 ， 而 不 是 从 
该 处 理 程序 返回 。 图 10-8 和 图 10-11 中 已 经 出 现 了 这 种 情况 。 

但 是 ， 调 用 longjmp 有 一 个 问题 。 当 捕捉 到 一 个 信号 时 ， 进 入 信和 号 
捕捉 函数 ， 此 时 当前 信号 被 目 动 地 加 a 到 进程 的 信和 号 屏蔽 字 中 。 这 阻止 


了 后 来 产生 的 这 种 信号 中 断 该 信号 处 理 程 序 。 如 果 用 longjmp 跳 出 信和 号 
处 理 程 序 ， 那 么 ， 对 此 进程 的 信号 屏蔽 字 会 发 生 什么 呢 ? 

在 FreeBSD 8.0 和 Mac OS X 10.6.8! , setjmpilllongjmp B ££ Fl PX 
信和 号 屏蔽 字 。 但 是 ， Linux 3.2.041 Solaris 10 并 不 执行 这 种 操作 ， 虽 然 
Linux 支 持 提 供 BSD 行 为 的 选项 。FreeBSD 8.0 和 Mac OS X 10.6.85 DER 
数 _setjmp 和 _longjmp， 它 们 也 不 保存 和 恢复 信号 屏蔽 字 。 

为 了 允许 两 种 形式 并 存 ，POSIX.1 并 没有 指定 setjmp 和 longjmp 对 信 
号 屏 殴 字 的 作用 ， 而 是 定义 了 两 个 狐 函 数 sigsetjmp 和 和 siglongjmp。 在 信 
号 处 理 程序 中 进行 非 局 部 转移 时 应 当 使 用 这 两 个 函数 。 


#include <setjmp.h> 


int sigsetjmp(sigjmp_buf env, int savemask); 
返回 值 : 名 直接 调用 ， 返 回 0; 名 从 siglongjmp 调 用 返回 ， 则 返回 非 0 

void siglongjmp(sigjmp_buf env, int val); 

这 两 个 函数 和 setjmp ^ longjmp 之 间 的 唯一 区 别 是 sigsetjmp 增加 了 
一 个 参数 。 如 果 savemask 韭 0， 则 sigsetjmp 在 env 中 保存 进程 的 当前 信号 
ERF ° Val AsiglongjmphY, 402877 IEO savemask 的 sigsetjmp 调 用 已 经 
保存 了 env， 则 siglongjmp 从 其 中 恢复 保存 的 信号 屏蔽 字 。 

实例 

图 10-20 中 的 程序 演示 了 在 信和 号 处 理 程序 被 调用 时 ， 系 统 所 设置 的 
言 号 屏蔽 字 如 何 上 自动 地 包括 刚 被 捕捉 到 的 信号 。 此 程序 也 示例 说 明了 
如 何 使 用 sigsetjmp 和 siglongjmp 函 数 。 


#include "apue .hy" 
#include <setjmp.h> 
#include <time.h> 


static 
static 
static 
static 


int 


main (void) 


{ 
if 


void sig usrl(int); 
void sig alrm(int); 
sigjmp buf jmpbuf; 
volatile sig atomic t canjump; 
(signal(SIGUSR1, sig usrl) == SIG ERR) 


err Sys("signal(SIGUSRl1) error"); 


if (signal(SIGALRM, sig alrm) -- SIG ERR) 
err sys("signal(SIGALRM) error"); 


pr mask("starting main: "); /* Figure 10.14 */ 
if (sigsetjmp(jmpbuf, 1)) ( 
pr mask("ending main: "); 
exit(0); 
) 
canjump = 1; /* now sigsetjmp() is OK */ 
for (7 7 ) 
pause(); 
} 
static void 


sig_usrl(int signo) 


{ 


time_t starttime; 
if (canjump == 0) 
return; /* unexpected signal, ignore */ 


pr mask("starting sig usrl: "); 


alarm(3); /* SIGALRM in 3 seconds */ 
starttime - time (NULL); 
for ( Fi i) /* busy wait for 5 seconds */ 
if (time(NULL) > starttime + 5) 
break; 
pr mask("finishing sig usrl: "); 


canjump = 0; 
siglongjmp(jmpbuf, 1); /* jump back to main, don't return */ 
} 


static void 
sig_alrm(int signo) 
{ 
pr_mask("in sig_alrm: "); 


} 


图 10-20 信和 号 屏蔽 、sigsetmp 和 siglongjmp 实 例 


此 程序 演示 了 另 一 种 技术 ， 只 要 在 信号 处 理 程序 中 调用 siglongjmp 
就 应 使 用 这 种 技术 。 仅 在 调用 sigsetjmp 之 后 才 将 变量 canjump 设 置 为 非 0 
值 。 在 信号 处 理 程序 中 检测 此 变量 ， 仅 当 它 为 非 0 值 时 才 调 用 


siglongjmp。 这 提供 了 一 种 保护 机 制 ， 使 得 在 jmpbuf ( 跳 转 缓冲 ) 尚未 
由 sigsetjmp 初始 化 时 ， 防 止 调用 信号 处 理 程序 。 (在 本 程序 中 ， 
siglongjmp 之 后 程序 很 快 就 结束 ， 但 是 在 较 大 的 程序 中 ， 在 siglongjmp 
之 后 的 较 长 一 段 时 间 内 ， 信 号 处 理 程序 可 能 仍旧 被 设置 ) 。 在 一 般 的 C 
代码 中 〈 不 是 信号 处 理 程序 ) ， 对 于 longjmp 并 不 需要 这 种 保护 措施 。 
但 是 ， 因 为 信号 可 能 在 任何 时 候 发 生 ， 所 以 在 信号 处 理 程序 中 ， 需 要 
这 种 保护 措施 。 

在 程序 中 使 用 了 数据 类 型 sig_atomic_t， 这 是 由 ISO C 标 准 定义 的 变 
量 类 型 ， 在 写 这 种 类 型 变量 时 不 会 被 中 断 。 这 意味 着 在 具有 虚拟 存储 
器 的 系统 上 ， 这 种 变量 不 会 跨越 页 边界 ， 可 以 用 一 条 机 器 指令 对 其 进 
行 访问 。 这 种 类 型 的 变量 总 是 包括 ISO 类 型 修饰 符 volatile， 其 原因 是 : 
该 变量 将 由 两 个 不 同 的 控制 线程 一 一 main 函数 和 异步 执行 的 信号 处 理 
程序 访问 。 图 10-21 显 示 了 此 程序 的 执行 时 间 顺 序 。 可 将 图 10-21 分 成 三 
部 分 : 左面 部 分 (对 应 于 main) ， 中 间 部 分 (sig usr1) 和 右面 部 分 
(sig_alrm) 。 在 进程 执行 左面 部 分 时 ， 信 号 屏蔽 字 是 0 (没有 信和 号 是 
阻塞 的 ) 。 而 执行 中 间 部 分 时 ， 其 信号 屏蔽 字 是 SIGUSR1。 执 行 右面 
部 分 时 ， 信 号 屏蔽 字 是 SIGUSR1 | SIGALRM ° 


signal() 
signal() 
pr mask() 
sigsetjmp() 
pause() 
SIGUSR1 递送 P 
MES - sig usrl 
r mask 
PE 
time() 
time() 
time() 
SIGALRM 递送 ; 
pr mask() 
一 - return() 
从 信号 处 理 程序 中 返回 
Y 
pr mask() 
sigsetjmp() -«—— — — siglongjmp() 
pr mask() 
exit() 


5110-21 处 理 两 个 信号 的 实例 程序 的 时 间 顺 序 
执行 图 10-20 程 序 ， 得 到 下 面 的 输出 : 


$ /a.out & 在 后 台 启 动 进程 

starting main: 

[1] 531 作业 控制 shell 打 印 其 进程 
ID 

$ kill -USR1 531 [AIRE A XSSIGUSR1 


starting sig usr1: SIGUSR1 
$ in sig_alrm: SIGUSR1 SIGALRM 
finishing sig usr1: SIGUSR1 
ending main: 

88 A [n] = 
[1] * Done /a.out & 


该 输出 与 我 们 所 期 望 的 相同 : 当 调 用 一 个 信号 处 理 程序 时 ， 被 捕 
捉 到 的 信号 加 到 进程 的 当前 信号 屏蔽 字 中 。 当 从 信号 处 理 程序 返回 
上 时， 恢复 原来 的 屏 敞 字 。 男 外 ，siglongjmp 恢复 了 由 sigsetjmp 所 保存 的 
fei BEIC. ° 

如 果 在 Linux 中 将 图 10-20 程 序 中 的 sigsetmp 和 siglongjmp 分 别 替换 
成 setimp 和 ]longjmp (在 FreeBSD 中 ， 则 替换 成 _setjmp 和 _longjmp) ， 则 
最 后 一 行 输出 变 成 : 

ending main: SIGUSR1 

这 意味 着 在 调用 setjmp 之 后 执行 main 函数 时 ， 其 SIGUSR1 ÆRE 
窟 的 。 这 多 半 不 是 我 们 所 希望 的 。 


10.16 图 数 sigsuspend 


上 面 已 经 说 明 ， 更 改进 程 的 信号 屏蔽 字 可 以 阻塞 所 选择 的 信和 号， 
或 解除 对 它们 的 阻 蹇 。 使 用 这 种 技术 可 以 保护 不 希望 由 信和 号 中 断 的 代 
码 I 临 界 区 。 如 果 硕 望 对 一 个 信号 解除 阻塞 ， 然 后 pause 以 等 竺 以 前 被 阻 
塞 的 信号 发 生 ， 则 又 将 如 何 呢 ? 假定 信号 是 SIGINT， 实 现 这 一 点 的 一 
种 不 正确 的 方法 是 : 

sigset t newmask, oldmask; 

sigemptyset(&newmask); 

sigaddset(&newmask, SIGINT); 

/* block SIGINT and save current signal mask */ 

if (sigprocmask(SIG BLOCK, &newmask, &oldmask) « 0) 

err sys("SIG BLOCK error"); 
/* critical region of code */ 
/* restore signal mask, which unblocks SIGINT */ 


if (sigprocmask(SIG SETMASK, &oldmask, NULL) « 0) 
err sys("SIG SETMASK error"); 

/* window is open */ 

pause(); /* wait for signal to occur */ 

/* continue processing */ 

URE SREY, PETES, MAIR B) AMAER B. 
到 对 它 解 除了 阻塞 。 对 应 用 程序 而 言 ， 该 信号 好 像 发 生 在 解除 对 
SIGINT 的 阻塞 和 pause 之 间 (取决 于 内 核 如 何 实 现 信号 ; 。 如 果 发 生 了 
这 种 情况 ， 或 者 如 果 在 解除 阻塞 时 刻 和 pause 之 则 确实 发 生 了 信号 ， 那 
么 就 会 产生 问题 。 因 为 可 能 不 会 再 见 到 该 信号 ， 所 以 从 这 种 意义 上 
讲 ， 在 此 时 间 窗 口中 发 生 的 信号 丢失 了 ， 这 样 惑 使 得 pause 永 远 阻 塞 。 
这 是 早期 的 不 可 菲 信 和 号 机 制 的 男 一 个 问题 。 

为 了 纠正 此 问题 ， 需 要 在 一 个 原子 操作 中 先 恢复 信号 屏蔽 字 ， 然 
后 使 进程 休眠 。 这 种 功能 是 由 sigsuspend 函 数 所 提供 的 。 


#include <signal.h> 


int sigsuspend(const sigset t *sigmask); 
返回 值 ，-1， 并 将 errno 设 置 为 EINTR 

进程 的 信号 屏蔽 字 设 置 为 由 sigmask 指 向 的 值 。 在 捕捉 到 一 个 信号 
或 发 生 了 一 个 会 终止 该 进程 的 信号 之 前 ， 该 进程 被 挂 起 。 如 有 捕捉 到 
一 个 信号 而 且 从 该 信号 处 理 程序 返回 ， 则 sigsuspend 返 回 ， 并 且 该 进程 
的 信号 屏蔽 字 设 置 为 调用 sigsuspend 之 前 的 值 。 

注意 ， 此 函数 没有 成 功 返 回 值 。 如 果 它 返回 到 调用 者 ， 则 总 是 返 
回 -1， 并 将 ermo 设置 为 EINTR (表示 一 个 被 中 断 的 系统 调用 ) 。 

实例 

图 10-22 显 示 了 保护 代码 临 弄 区 ， 使 其 不 被 特定 信号 中 断 的 正确 方 


#include "apue.h" 
static void sig_int(int); 
int 


main (void) 


{ 


sigset t newmask, oldmask, waitmask; 


pr mask("program start: "); 


if (signal(SIGINT, sig int) -- SIG ERR) 
err sys("signal(SIGINT) error"); 
sigemptyset(&waitmask); 
sigaddset(&waitmask, SIGUSR1); 
sigemptyset (&newmask) ; 
sigaddset(&newmask, SIGINT); 


/* 
* Block SIGINT and save current signal mask. 
ei 
if (sigprocmask(SIG BLOCK, &newmask, &oldmask) < 0) 
err sys ("SIG BLOCK error"); 


/* 
* Critical region of code. 
XY 
pr mask("in critical region: "); 


/* 
* Pause, allowing all signals except SIGUSRI. 
xy 

if (sigsuspend(&waitmask) != -1) 


err sys("sigsuspend error"); 


pr mask("after return from sigsuspend: "); 


/* 

* Reset signal mask which unblocks SIGINT. 

"er 

if (sigprocmask(SIG SETMASK, &oldmask, NULL) « 0) 
err sys("SIG SETMASK error"); 


/* 
* And continue processing 
*/ 
pr mask("program exit: "); 
exit(0); 


static void 
Sig int(int signo) 
( 


pr mask("Nnin sig int: "); 


110-22 保护 临界 区 不 被 信号 中 断 


注意 ， 当 sigsuspend 返 回 时 ， 它 将 信号 屏蔽 字 设 置 为 调用 它 之 前 的 
值 。 在 本 例 中 ，SIGINT 信 号 将 被 阻塞 。 因 此 将 信号 屏蔽 恢复 为 之 前 保 
存 的 值 (oldmask) 

运行 图 10-22 中 的 程序 得 到 下 面 的 输出 : 


$ ./a.out 


program start: 

in critical region: SIGINT 

^C 键入 中 断 字符 

insig int: SIGINT SIGUSR1 

after return from sigsuspend: SIGINT 

program exit: 

在 调用 sigsuspend 时 ， 将 SIGUSRI 信 和 号 加 到 了 进程 信号 屏蔽 字 中 ， 
所 以 当 运 行 该 信号 处 理 程序 时 ， 我 们 得 知 信号 屏蔽 字 已 经 改变 了 。 从 
中 可 见 ， 在 sigsuspend 返回 时 ， 它 将 信号 屏 贡 字 恢复 为 调用 它 之 前 的 
值 。 

实例 

sigsuspend 的 另 一 种 应 用 是 等 竺 一 个 信号 处 理 程 序 设 置 一 个 全 局 变 
量 。 图 10-23 中 的 程序 用 于 捕捉 中 断 信号 和 退出 信号 ， 但 是 希望 仅 当 捕 
捉 到 退出 信号 时 ， 才 唤醒 主 例 程 。 


#include "apue.h" 


volatile sig atomic t quitflag; /* set nonzero by signal handler */ 


static void 
sig int(int signo) /* one signal handler for SIGINT and SIGQUIT */ 
( 
if (signo == SIGINT) 
printf ("Mninterrupt Nin"); 
else if (signo == SIGQUIT) 
quitflag = 1; /* set flag for main loop */ 


int 
main (void) 
{ 


sigset_t newmask, oldmask, zeromask; 


if (signal(SIGINT, sig_int) == SIG_ERR) 
err_sys("signal(SIGINT) error"); 
if (signal (SIGQUIT, sig int) == SIG ERR) 


err_sys("signal(SIGQUIT) error"); 


sigemptyset (&zeromask) ; 
sigemptyset (&newmask) ; 
sigaddset (&newmask, SIGQUIT); 


/* 

* Block SIGQUIT and save current signal mask. 

wy 

if (sigprocmask(SIG BLOCK, &newmask, &oldmask) « 0) 
err sys("SIG BLOCK error"); 


while (quitflag -- 0) 
sigsuspend(&zeromask); 


/* 


* SIGQUIT has been caught and is now blocked; do whatever. 
wy 
quitflag - 0; 


/* 
* Reset signal mask which unblocks SIGQUIT. 
x 
if (sigprocmask(SIG SETMASK, &oldmask, NULL) « 0) 
err sSys("SIG SETMASK error"); 


exit(0); 


图 10-23 用 sigsuspend 等 待 一 个 全 局 变量 被 设置 


此 程序 的 样本 输出 是 : 


$ /a.out 

AC 键入 中 断 字符 
interrupt 

^C 再 次 键入 中 断 字 符 
interrupt 

^C 再 一 次 

interrupt 

N$ 用 退出 符 终 止 


考虑 到 文 持 ISO C 的 非 POSIX 系 统 与 POSIX 系 统 两 者 之 间 的 可 移植 
性 ， 在 一 个 信号 处 理 程序 中 唯一 应 当做 的 是 为 sig_atomic t 类 型 的 变量 
赋 一 个 值 。POSIX.1 规 定 得 更 多 一 些 ， 它 详细 说 明了 在 一 个 信号 处 理 程 
序 中 可 以 安全 地 调用 的 函数 列表 〈 见 图 10-4) ， 但 是 如 果 这 样 来 编写 代 
码 ， 则 它们 可 能 不 会 正确 地 在 非 POSIX 系 统 上 运行 。 

实例 

可 以 用 信号 实现 父 、 子 进程 之 间 的 同步 ， 这 是 信号 应 用 的 另 一 个 
实例 。 图 10-24 给 出 了 8.9 市 中 提 到 的 5 个 例 程 的 实现 ， 它 们 是 
TELLWAIT ` TELL PARENT ` TELL CHILD ` WAIT. PARENT 和 
WAIT. CHILD ° 


#include "apue.h" 


static volatile sig atomic t sigflag; /* set nonzero by sig handler */ 
static sigset t newmask, oldmask, zeromask; 


static void 
sig usr(int signo) /* one signal handler for SIGUSR1 and SIGUSR2 */ 
{ 

sigflag = 1; 


void 
TELL_WAIT (void) 
{ 
if (signal(SIGUSR1, sig usr) == SIG ERR) 
err sys("signal(SIGUSR1) error"); 


if (signal(SIGUSR2, sig usr) == SIG ERR) 
err sys("signal(SIGUSR2) error"); 

Sigemptyset(&zeromask); 

sigemptyset (&newmask) ; 

sigaddset (&newmask, SIGUSR1); 

sigaddset (&newmask, SIGUSR2); 


/* Block SIGUSR1 and SIGUSR2, and save current signal mask */ 
if (sigprocmask(SIG_BLOCK, &newmask, &oldmask) < 0) 
err_sys("SIG BLOCK error"); 


void 
TELL PARENT (pid t pid) 
( 
kill(pid, SIGUSR2); /* tell parent we're done */ 


void 
WAIT PARENT (void) 
( 
while (sigflag == 0) 
sigsuspend(&zeromask); /* and wait for parent */ 


sigflag = 0; 


/* Reset signal mask to original value */ 
if (sigprocmask(SIG_SETMASK, &oldmask, NULL) < 0) 
err_sys("SIG_SETMASK error"); 


void 
TELL_CHILD(pid_t pid) 


{ 
kill (pid, SIGUSR1); /* tell child we're done */ 


void 
WAIT CHILD (void) 
{ 
while (sigflag == 0) 
sigsuspend(&zeromask); /* and wait for child */ 


sigflag = 0; 


/* Reset signal mask to original value */ 
if (sigprocmask(SIG SETMASK, &oldmask, NULL) « 0) 
err Sys("SIG SETMASK error"); 


F 


Fd10-24 父子 进程 可 用 来 实现 同步 的 例 程 


其 中 使 用 了 两 个 用 户 定 义 的 信号 : SIGUSR1 由 父 进 程 发 送 给 子 进 
SIGUSR2 由 子 进 程 发送 给 父 进程 。 图 15-7 显 示 了 使 用 管道 的 这 5 个 


程 


» 


ERAN Fa — PSE EM o 

如 果 在 等 竺 信号 发 生 时 和 硕 望 去 休眠 ， 则 使 用 sigsuspend 函数 是 非 
常 适当 的 (正如 在 前 面 两 个 例子 中 所 示 ) ， 但 是 如 果 在 等 待 信号 期 间 
希望 调用 其 他 系统 函数 ， 那 么 将 会 怎样 呢 ? 遗憾 的 是 ， 在 单线 程 环境 
下 对 此 问题 没有 妥善 的 解决 方法 。 如 果 可 以 使 用 多 线程 ， 则 可 专门 安 
排 一 个 线程 处 理 信号 ( 见 12.8 节 中 的 讨论 ) 

如 采 不 使 用 线程 ， 那 么 我 们 能 尽力 做 到 最 好 的 是 ， 当 信号 发 生 
时 ， 在 信号 捕捉 程序 中 对 一 个 全 局 变量 置 1° 例如 ， 若 我 们 捕捉 SIGINT 
和 SIGALRM 这 两 种 信号 ， 并 用 signal_intr 函 数 设置 这 两 个 信号 的 处 理 程 
序 ， 使 得 它们 中 断 任 一 被 阻塞 的 慢 速 系统 调用 。 当 进程 阻塞 在 调用 read 
函数 等 待 慢 速 设备 输入 时 ， 很 可 能 发 生 这 两 种 信号 (如 果 设 置 闹钟 以 
阻止 永远 等 待 输入， 那么 对 于 SIGALRM 信 和 号， 这 种 情况 尤其 会 发 
Æ) 。 处 理 这 种 问题 的 代码 类 似 于 下 面 所 示 : 


if (intr_flag) /* flag set by our SIGINT handler */ 
handle_intr(); 
if (alrm_flag) /* flag set by our SIGALRM handler */ 


handle alrm(); 
/* signals occurring in here are lost */ 
while (read( ... ) < 0) 1 
if (errno == EINTR) { 
if (alrm_flag) 
handle_alrm(); 
else if (intr_flag) 
handle intr(); 
} else 1 
/* some other error */ 


} 


} else if (n == 0) ( 
/* end of file */ 
} else { 
/* process input */ 
} 
在 调用 read 之 前 测试 各 全 局 标志 ， 如 采 read 返 回 一 个 中 断 的 系统 调 
用 错误 ， 则 再 次 进行 测试 。 如 果 在 前 两 个 语句 和 后 随 的 read 调用 之 间 
捕捉 到 两 个 信号 中 的 任意 一 个 ， 则 问题 就 发 生 了 。 正 如 代码 中 的 注释 
所 指出 的 ， 在 此 处 发 生 的 信号 丢失 了 。 调 用 信和 号 处 理 程序 ， 它 们 设置 
了 相应 的 全 局 变量 ,但 是 read 决 不 会 返回 〈 除 非 某 些 数据 已 准备 好 可 
B) 。 
我 们 希望 实现 下 列 操作 步 又 。 
(1) 阻塞 SIGINT 和 SIGALRM ° 
(2) 测试 两 个 全 局 变量 以 判别 是 否 发 生 了 一 个 信号 ， 如 果 已 发 生 
则 对 此 进行 处 理 。 
(3) 调用 read (或 任何 其 他 系统 函数 ) 并 解除 对 这 两 个 信号 的 阻 
罕 ， 这 两 个 操作 应 当 是 一 个 原子 操作 。 
MAB (3) 步 是 pause 操 作 时 ，sigsuspend 函 数 才 能 帮助 我 们 。 


10.17 abort 
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#include <stdlib.h> 
void abort(void); 


此 函数 不 返回 值 


此 函数 将 SIGABRT 信 号 发 送 给 调用 进程 (进程 不 应 忽略 此 信 
5) 。ISO C 规 定 ， 调 用 abort 将 向 主机 环境 递送 一 个 未 成 功 终止 的 通 
知 ， 其 方法 是 调用 raise(SIGABRT) 函 数 。 

ISO C 要 求 若 捕捉 到 此 信号 而 且 相 应 信号 处 理 程 序 返 回 ，abort 仍 不 
会 返回 到 其 调用 者 。 如 果 捕 捉 到 此 信号 ， 则 信号 处 理 程序 不 能 返回 的 
唯一 方法 是 它 调用 exit、_exit、_Exit、longjmp 或 siglongjmp (10.15% r} 
论 了 longjmp 和 siglongjmp 之 间 的 区 别 ) 。POSIX.1 也 说 明 abort 并 不 理会 
进程 对 此 信号 的 阻塞 和 和 忽略。 

让 进程 捕捉 SIGABRT 的 意图 是 : 在 进程 终止 之 前 由 其 执行 所 需 的 
清理 操作 。 如 果 进 程 并 不 在 信号 处 理 程序 中 终止 自己 ，POSIX.1 声 明 当 
言 号 处 理 程序 返回 时 ，abort 终 止 该 进程 。 

ISO C 针 对 此 函数 的 规范 将 下 列 问 题 留 由 实现 决定 : 是 否 要 冲洗 输 
出 流 以 及 是 否 要 删除 临时 文件 〈 见 5.13 节 ) ° POSIX.1 的 要 求 则 更 进 一 
步 ， 它 要 求 如 果 abort 调 用 终止 进程 ， 则 它 对 所 有 打开 标准 1/O 流 的 效果 
应 当 与 进程 终止 前 对 每 个 流 调 用 fclose 相 同 。 

SystemV 的 早期 版 本 中 ，abort 函 数 产 生 SIGIOT 信 号 。 更 进一步 ， 
进程 忽略 此 信号 或 者 捕捉 它 并 从 信号 处 理 程序 返回 ， 这 都 是 可 能 的 ， 
在 返回 情况 下 ，abort 返 回 到 它 的 调用 者 。 

4.3BSD 产 生 SIGILL 信 和 号。 在 此 之 前 ， 该 函数 解除 对 此 信号 的 阻 
塞 ， 将 其 配置 恢复 为 SIG_DFL (终止 并 创建 core 文 件 ) 。 这 阻止 一 个 
进程 名 上 略 或 捕捉 此 信号。 

历史 上 ，abort 的 各 种 实现 在 如 何 处 理 标准 VO 流 方 面 是 并 不 相同 
的 。 对 于 保护 性 的 程序 设计 以 及 为 提高 可 移植 性 ， 如 果 和 希望 冲洗 标准 
IO 流 ， 则 在 调用 abort 之 前 要 执行 这 种 操作 。 在 err_dump 范 数 中 实现 
了 这 一 点 ( 见 附录 B) 。 

因为 大 多 数 UNIX 系 统 tmpfile (临时 文件 ) 的 实现 在 创建 该 文件 之 
后 立即 调用 unlink， 所 以 ISO C 关 于 临时 文件 的 警告 通常 与 我 们 无 关 。 


实例 
图 10-25 中 的 abort 函 数 是 按 POSIX.1 说 明 实 现 的 。 


#include <signal.h> 
#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 


void 
abort (void) /* POSIX-style abort() function */ 
{ 

sigset_t mask; 

struct sigaction action; 


/* Caller can't ignore SIGABRT, if so reset to default */ 
sigaction(SIGABRT, NULL, &action); 
if (action.sa handler == SIG IGN) { 

action.sa handler = SIG DFL; 

Sigaction(SIGABRT, &action, NULL); 


if (action.sa handler == SIG DFL) 
fflush (NULL); /* flush all open stdio streams */ 


/* Caller can't block SIGABRT; make sure it's unblocked */ 


sigfillset (&mask) ; 
sigdelset (&émask, SIGABRT); /* mask has only SIGABRT turned off */ 


sigprocmask(SIG_SETMASK, &mask, NULL); 
kill (getpid(), SIGABRT) ; /* send the signal */ 


/* If we're here, process caught SIGABRT and returned */ 


fflush (NULL) ; /* flush all open stdio streams */ 
action.sa_ handler = SIG DFL; 

sigaction(SIGABRT, &action, NULL); /* reset to default */ 
sigprocmask(SIG SETMASK, &mask, NULL); /* just in case ... */ 
kill(getpid(), SIGABRT); /* and one more time */ 
exit(1); /* this should never be executed ... */ 


图 10-25 abort 的 POSIX.1 实 现 

首 移 查 看 是 否 将 执行 默认 动作 ， 关 是 则 神 洗 所 有 标准 MO 流 。 这 并 
不 等 价 于 对 所 有 打开 的 流 调用 fclose (因为 只 冲洗 ， 并 不 关闭 它们 ) 
但 是 当 进 程 终止 时 ， 系 统 会 关闭 所 有 打开 的 文件 。 如 宁 进 程 捕捉 此 信 
号 并 返回 ， 那 么 因为 进程 可 能 产生 了 更 多 的 输出 ， 所 以 再 一 次 冲洗 所 
有 的 流 。 不 进行 冲洗 处 理 的 唯一 条 件 是 如 采 进 程 捕 捉 此 信号 ， 然 后 调 


用 _exit 或 _Exit。 在 这 种 情况 下 ， 任 何 未 冲洗 的 内 存 中 的 标准 IO 缓存 都 
TUER BETTE. mH exits ExitlJ Us HAS Ah 
洗 缓冲 区 。 

回忆 10.9 市 ， 如 有 果 调 用 kill 使 其 为 调用 者 产生 信和 号， 并 有 旦 如 果 该 信 
号 是 不 被 阻塞 的 〈 图 10-25 中 的 程序 保证 做 到 这 一 点 ) ， 则 在 kil 返 回 前 
该 信号 〈 或 某 个 未 决 、 未 阻塞 的 信号 ) 就 被 传送 给 了 该 进程 。 我 们 阻 
窄 除 SIGABRT 外 的 所 有 信号 ， 这 样 就 可 知 如 果 对 ki 的 调用 返回 了 ， 则 
该 进程 一 定 已 捕捉 到 该 信号 ， 并 且 也 从 该 信号 处 理 程序 返回 。 


10.18 ER2Z system 


8.135 LAA T —"systemERZAB) SEE, [HAETATBUISJEASNDAUG EE TT 
信号 处 理 。POSIX.1 X 5& system /Z WE SIGINT #1 SIGQUIT , EH Æ 
SIGCHLD。 在 给 出 一 个 正确 地 处 理 这 些 信号 的 一 个 版 本 之 前 ， 先 说 明 
为 什么 要 考虑 信和 号 处 理 。 

实例 

图 10-26 中 的 程序 使 用 8.13 节 中 的 system 版 本 ， 用 其 调用 ed(1) 编 辑 
器 。 (ed 编辑 器 很 久 以 来 就 是 UNIX 的 组 成 部 分 。 在 这 里 使 用 它 的 原因 
fe: 它 是 捕捉 中 断 和 退出 信号 的 交互 式 程序 。 若 从 shell 调 用 ed， 并 键入 
中 断 字符 ， 则 它 捕捉 中 断 信 号 并 打印 问号 。ed 程 序 对 退出 信号 的 处 理 
方式 设置 为 忽略 。) 

图 10-26 中 的 程序 用 于 捕捉 SIGINT 和 SIGCHLD 信 号 。 若 调用 它 则 
可 得 : 

$ ./a.out 

a 将 正文 追加 至 编辑 器 缓冲 区 


Here is one line of text 


行 首 的 点 停止 追加 方式 
1,$p 打印 缓冲 区 中 的 第 一 行 至 最 后 一 行 ， 以 


便 观察 其 内 容 
Here is one line of text 
w temp.foo 将 缓冲 区 写 至 一 文件 
25 Jak aM F25 T6 
q 离开 编辑 器 
caught SIGCHLD 


r1 


Eo XP 
[n] o 


应 当 这 样 做 以 便 了 解 它 的 子 进 程 在 何 时 终止 )， 那 么 正在 执行 System 函 


当 编 辑 器 终止 时 ， 系 统 向 父 进 程 (a.out 进 程 )》 发 送 SIGCHLD 信 
父 进程 捕捉 它 ， 执 行 其 处 理 程序 sig_chid， 然 后 从 信和 号 处 理 程序 返 
但 是 着 父 进程 正 捕 捉 SIGCHLD 信和 号 (因为 它 创建 了 子 进程 ， 所 以 


数 时 ， 应 当 阻 塞 对 父 进 程 递送 SIGCHLD 信 号 。 实 际 上 ， 这 就 是 
POSIX.1 所 说 明 的 。 否 则 ， 当 system 创 建 的 子 进程 结束 时 ，system 的 调 
用 者 可 能 错误 地 认为 ， 它 目 己 的 一 个 子 进程 结束 了 了。 于是， 调用 者 将 
会 调用 一 种 wait 函 数 以 获得 子 进程 的 终止 状态 ， 这 样 焉 阻止 了 system 画 
数 获 得 子 进程 的 终止 状态 ， 并 将 其 作为 它 的 返回 值 。 


#include "apue.h" 


static void 
sig int(int signo) 


{ 


printf ("caught SIGINT\n") ; 


} 


static void 
sig_chld(int signo) 
{ 


printf ("caught SIGCHLD\n") ; 


} 


int 
main (void) 


{ 


if (signal(SIGINT, sig_int) == SIG_ERR) 
err_sys ("signal (SIGINT) error"); 
if (signal(SIGCHLD, sig_chld) == SIG_ERR) 


err_sys ("signal (SIGCHLD) error"); 


if (system("/bin/ed") 
err_sys ("system () 


exit (0); 


< 0) 


error"); 


图 10-26 用 syetem 调 用 ed 编辑 器 


如 果 再 次 执行 该 程序 ， 在 这 次 运行 时 将 一 个 中 断 信号 传送 给 编辑 


ag, MPJ: 
$ /a.out 
a 
hello, world 


1,$p 
其 内 容 

hello, world 

w temp.foo 

13 

AC 

2 
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行 首 的 点 停止 追加 方式 
打印 缓冲 区 中 的 第 一 行 至 最 后 一 行 ， 以 便 观察 


将 缓冲 区 写 至 一 文件 

编辑 器 称 写 了 13 个 字 廊 
键入 中 断 符 

编辑 器 捕捉 信号 ， 打 印 问号 


caught SIGINT 父 进程 执行 同一 操作 

q 离开 编辑 器 

caught SIGCHLD 

回忆 9.6 节 可 知 ， 刍 入 中 断 字符 可 使 中 断 信号 传送 给 前 台 进 程 组 中 
的 所 有 进程 。 图 10-27 展 示 了 编辑 器 正在 运行 时 的 各 个 进程 的 关系 。 


| l 

| | | 

| 登录 shell | /bin/ed 
| | | 

l | 


后 台 进 程 组 前 台 进 程 组 
图 10-27 图 10-26 程 序 运行 时 的 前 台 和 后 台 进 程 组 

在 这 一 实例 中 ，SIGINT 被 送 给 3 个 前 台 进 程 (shell 进 程 忽略 此 信 
号 ) 。 从 输出 中 可 见 ，a.out 进 程 和 ed 进程 捕捉 该 信号 。 但 是 ， 当 用 
System 运行 另 一 个 程序 时 ， 不 应 使 父 、 子 进程 两 者 都 捕捉 终端 产生 的 两 
个 信号 : 中 断 和 退出 。 这 两 个 信号 只 应 发 送 给 正在 运行 的 程序 : TE 
程 。 因 为 由 system 执 行 的 命令 可 能 是 交互 式 命令 (如 本 例 中 的 ed) ， 以 
及 因为 system 的 调用 者 在 程序 执行 时 放弃 了 控制 ， 等 得 该 执行 程序 的 结 
束 ， 所 以 system 的 调用 者 就 不 应 接收 这 两 个 终 病 产生 的 信号 。 这 就是 为 
什么 POSIX.1 规 定 system 的 调用 者 在 等 得 命令 完成 时 应 当 名 上 略 这 两 个 信 
号 的 原因 。 

实例 

图 10-28 中 的 程序 是 system 了 芳 数 的 男 一 个 实现 ， 它 进行 了 所 要 求 的 
言 号 处 理 。 


finclude <sys/wait.h> 


#include <errno.h> 
#include <signal.h> 
#include <unistd.h> 
int 
system(const char *cmdstring) /* with appropriate signal handling */ 
{ 
pid t pid; 
int status; 


struct sigaction ignore, saveintr, savequit; 
sigset t chldmask, savemask; 


if (cmdstring == NULL) 
return(1); /* always a command processor with UNIX */ 


ignore.sa handler - SIG IGN; /* ignore SIGINT and SIGQUIT */ 

sigemptyset(&ignore.sa mask); 

ignore.sa flags - 0; 

if (sigaction(SIGINT, &ignore, &saveintr) « 0) 
return(-1); 

if (sigaction(SIGQUIT, &ignore, &savequit) « 0) 
return(-1); 

sigemptyset (&chldmask) ; /* now block SIGCHLD */ 

sigaddset (&chldmask, SIGCHLD) ; 

if (sigprocmask(SIG BLOCK, &chldmask, &savemask) < 0) 
return(-1); 


if ((pid = fork()) « 0) { 
status = -1; /* probably out of processes */ 

} else if (pid == 0) { /* child */ 
/* restore previous signal actions & reset signal mask */ 
Sigaction(SIGINT, &saveintr, NULL); 


sigaction(SIGQUIT, &savequit, NULL); 
Sigprocmask(SIG SETMASK, &savemask, NULL); 


execl("/bin/sh", "sh", "-c", cmdstring, (char *)0); 
exit(127); /* exec error */ 
) else ( /* parent */ 
while (waitpid(pid, &status, 0) < 0) 
if (errno != EINTR) { 
status = -1; /* error other than EINTR from waitpid() */ 
break; 


} 


/* restore previous signal actions & reset signal mask */ 
if (sigaction(SIGINT, &saveintr, NULL) < 0) 
return (-1); 
if (sigaction(SIGQUIT, &savequit, NULL) < 0) 
return(-1); 
if (sigprocmask(SIG SETMASK, &savemask, NULL) < 0) 
return(-1); 


return(status); 


图 10-28 system ER ZB JPOSIX. 11E f/f SCE 


OR 10-26 FARE? = system ER BL AIX — SEA ERE, AB PT 
产生 的 二 进 制 代码 与 上 一 个 有 缺陷 的 程序 相 比较 ， 存 在 如 下 差别 。 

(1) 当 我 们 键入 中 断 字符 或 退出 字符 时 ， 不 向 调用 进程 发 送信 
= o 

(2) 4 ed 命令 终止 时 ， 不 向 调用 进程 发 送 SIGCHLD 信号 。 作为 
TRAC. TERRIYGKEÉHUsigprocmask 调用 对 SIGCHLD 信号 解除 阻塞 之 
前 ，SIGCHLD 信号 一 直 被 蛆 塞 。 而 对 sigprocmask 范 数 的 这 一 次 调用 是 
在 system 范 数 调 用 waitpid 获 取 子 进程 的 终止 状态 之 后 。 

POSIX.1308H, ÆSIGCHLDR AH], W wait waitpidiX [8] T F 
进程 的 状态 ， 那 么 SIGCHLD 信 和 号 不 应 递送 给 该 父 进程 ， 除 非 另 一 个 子 
进程 的 状态 也 可 用 。FreeBSD 8.0、Mac OS X 10.6.8 和 Solaris 10 都 实现 
了 这 种 语义 ， 而 Linux 3.2.0 没 有 实现 这 种 语义 ， 在 system 函 数 调 用 了 
waitpid Ja, SIGCHLD 保持 为 未 决 ; 当 解 除了 对 此 信号 的 阻 蹇 后 ， 它 被 
递送 至 调用 者 。 如 果 我 们 在 图 10-26 的 sig_chld 函 数 中 调用 wait，Linux 系 


统 将 返回 -1， 并 将 errno 设 置 为 ECHILD [X 7jsystemERZ& E AN EI tee 
的 终止 状态 。 
很 多 较 早 的 书 中 使 用 下 列 程序 段 ， 它 忽略 中 断 和 退出 信和 号: 
if ( (pid = fork()) < 0){ 
err sys("fork error"); 
Jelse if (pid == 0) { 
/* child */ 
execl(...); 
_exit(127); 

} 

/* parent */ 

old intr = signal(SIGINT, SIG_IGN); 

old quit = signal(SIGQUIT, SIG. IGN); 

waitpid(pid, &status, 0) 

signal(SIGINT, old intr); 

signal(SIGQUIT, old quit); 

这 段 代 码 的 问题 是 : 在 fork 之 后 不 能 保证 父 进程 还 是 子 进程 移 运 
行 。 如 果子 进程 和 完 运 行 ， 父 进程 在 一 段 时 间 后 再 运行 ， 那 么 在 父 进 程 
将 中 断 信号 的 处 理 更 改 为 忽略 之 前 ， 束 可 能 产生 这 种 信号 。 由 于 这 种 
原因 ， 图 10-28 中 在 fork 之 前 束 改 变 对 该 信号 的 配置 。 

注音， 了 于 进程 在 调用 exedl 之 前 要 先 恢复 这 两 个 信号 的 处 理 。 如 同 
8.10 市 中 所 说 明 的 一 样 ， 这 就 允许 在 调用 者 配置 的 基础 上 ，execl 可 将 它 
们 的 配置 更 改 为 默认 值 。 

system 的 返回 值 

注意 system 的 返回 值 ， 它 是 shell 的 终止 状态 ， 但 shell 的 终止 状态 并 
不 总 是 执行 命令 字符 串 进程 的 终止 状态 。 图 8-23 中 有 一 些 例子 ， 其 结 


正 是 我 们 所 期 望 的 。 如 果 执 行 一 条 如 date 那 样 的 简单 命令 ， 其 终止 状态 
是 0。 执 行 shell 命 令 exit 44， 则 得 终止 状态 44。 在 信和 号 方面 又 如 何 呢 ? 
运行 图 8-24 程 序 ， 并 向 正在 执行 的 命令 发 送 一 些 信 和 号 : 
$ tsys "sleep 30" 
^Cnormal termination, exit status = 130 Be A AT AF 


$ tsys "sleep 30" 

A\sh: 946 Quit 键入 退出 符 

normal termination, exit status = 131 

当 用 中 断 信号 终止 Sleep 时 ，Ppr_exit 函 数 〈 见 图 8-5) 认为 它 正 常 终 
止 。 当 用 退出 符 杀 死 sleep 进 程 时 ， 会 发 生 同 样 的 事情 。 终 止 状态 130、 
131 又 是 怎样 得 到 的 呢 ? 原来 Bourne shell 有 一 个 在 其 文档 中 没有 说 清楚 
的 特性 ， 其 终止 状态 是 128 加 上 一 个 信和 号 编号 ， 该 信号 终止 了 正在 执行 
的 命令 。 用 交互 方式 使 用 shell 可 以 看 到 这 一 点 。 


$ sh 确保 运行 Bourne shell 

$ sh -c "sleep 30" 

^C BEA FENIT 

$ echo $? 打印 最 后 一 条 命令 的 终止 状态 
130 


$ sh -c "sleep 30" 
Nsh: 962 Quit - core dumped 键入 退出 符 


$ echo $? 打印 最 后 一 条 命令 的 终止 状态 
131 
$ exit 离开 Bourne shell 


在 所 使 用 的 系统 中 ，SIGINT 的 值 为 2，SIGQUIT 的 值 为 93， 于 是 给 
出 shell 终 止 状态 130、131。 

再 试 一 个 类 似 的 例子 ， 这 一 次 将 一 个 信号 直接 送 给 shell， 然 后 观 
ZX system [H| fT ^A : 


$ tsys "sleep 30" & 这 一 次 在 后 台 局 动 它 

9257 

$ps -f 查看 进程 ID 

UID PID PPID TTY TIME CMD 

sar 9260 949 pts/5 0:00 ps -f 

sar 9258 9257 pts/5 0:00 sh -c sleep 30 
sar 949 947 pts/5 0:01 /bin/sh 

sar 9257 949 pts/5 0:00 tsys sleep 30 
sar 9259 9258 pts/5 0:00 sleep 30 

$ kill -KILL 9258 杀 死 shell 自 身 

abnormal termination, signal number = 9 rH nf IL, [X shell 5r 3 
第 终止 时 ，system 的 返回 值 才 报告 一 个 异常 终止 。 

其 他 的 shell 在 处 理 终 端 产 生 的 信号 (如 SIGINT 和 SIGQUIT) 时 表 
现 出 来 的 行为 各 不 相同 。 例 如 在 bash 和 dash 中 ， 键 入 中 断 或 退出 符 会 导 
致 市 有 对 应 信号 编号 的 表示 异 闸 终止 的 退出 状态 。 但 是 ， 如 果 发 现下 
在 执行 sleep 的 进程 并 直接 给 它 发 送信 号 ， 这 样 信号 只 会 到 达 单 个 进程 
而 不 是 整个 前 台 进 程 组 。 这 些 shell 与 Bourne shell 类 似 ， 以 正常 终止 状 
仿 128 加 上 信号 编号 退出 。 

在 编写 使 用 system 函 数 的 程序 时 ， 一 定 要 正确 地 解释 返回 值 。 如 果 
直接 调用 fork 、exec 和 wait， 则 终止 状态 与 调用 system 是 不 同 的 。 


10.19 图 数 sleep、nanosleep 和 clock nanosleep 


在 本 书 的 很 多 例子 中 都 已 使 用 了 sheep 画 数 ， 在 图 10-7 程 序 和 图 10- 
8 程序 中 有 两 个 sleep 的 实现 ， 但 它们 都 是 有 缺陷 的 。 


#include <unistd.h> 


unsigned int sleep(unsigned int seconds); 

REME: 0 或 未 休眠 完 的 秒 数 
此 函数 使 调用 进程 被 挂 起 直到 满足 下 面 两 个 条 件 之 一 。 
(1) 已 经 过 了 seconds 所 指定 的 墙 上 时 钟 时 间 。 
(2) 调用 进程 捕捉 到 一 个 信号 并 从 信和 号 处 理 程序 返回 。 
如 同 alarm 信 号 一 样 ， 由 于 其 他 系统 活动 ， 实 际 返 回 时 间 比 所 要 求 
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在 第 1 种 情形 ， 返 回 值 是 0。 当 由 于 捕捉 到 某 个 信号 sleep 提 早 返 回 
时 (第 2 种 情形 )  ， 返 回 值 是 未 休眠 完 的 秒 数 (所 要 求 的 时 间 减 去 实际 
休 卢 时间) 。 

尽管 sleep 可 以 用 alarm 函 数 ( 见 10.10 节 ) 实现 ， 但 这 并 不 是 必需 
的 。 如 果 使 用 alarm， 则 这 两 个 函数 之 间 可 能 相互 影响 。POSIX.1 标准 
对 这 些 相互 影 响 并 未 做 任何 说 明 。 例 如 ， 知 先 调用 alarm(10)， 过 了 3 各 
后 又 调用 sleep(5)， 那 么 将 如 何 呢 ? sleep 将 在 5 秒 后 返回 〈 假 定 在 这 段 时 
间 内 没有 捕捉 到 另 一 个 信号 ) ， 但 是 否 在 2 秒 后 又 产生 另 一 个 
SIGALRM 信 和 号 呢 ? 此 细节 与 具体 实现 有 关 。 

FreeBSD 8.0 ^ Linux 3.2.0 ^ Mac OS X 10.6.8 和 Solaris 10 用 
nanosleep X2 SZ Xllsleep, [sleep R SCIL fet RUBRI BEY ag TH ELA 
立 。 考 虑 到 可 移植 性 ， 不 应 对 sleep 的 实现 进行 任何 假定 ， 但 是 如 有 果 混 
合 调用 sleep 和 其 他 与 时 间 有 关 的 函数 ， 则 需 了 解 它 们 之 间 可 能 产生 的 
交互 。 

实例 

图 10-29 给 出 的 是 一 个 POSIX.1 sleep 函 数 的 实现 。 此 函数 是 图 10-7 
程序 的 修改 版 ， 它 可 靠 地 处 理 信 号 ， 避 免 了 早期 实现 中 的 竞争 条 件 ， 
但 是 仍 未 处 理 与 以 前 设置 的 疝 钟 的 交互 作用 (正如 前 面 提 到 的 ， 
POSIX.1 并 未 显 式 地 对 这 些 交 互 进行 定义 ) 。 


#include "apue.h" 


static void 
sig_alrm(int signo) 
{ 


/* nothing to do, just returning wakes up sigsuspend() */ 


unsigned int 

sleep (unsigned int seconds) 

{ 
struct sigaction newact, oldact; 
sigset_t newmask, oldmask, suspmask; 
unsigned int unslept; 


/* set our handler, save previous information */ 
newact.sa_handler = sig_alrm; 

sigemptyset (&newact.sa_mask) ; 

newact.sa_flags = 0; 

sigaction(SIGALRM, &newact, &oldact); 


/* block SIGALRM and save current signal mask */ 
sigemptyset (&newmask) ; 

sigaddset (&newmask, SIGALRM); 

sigprocmask(SIG BLOCK, &newmask, &oldmask) ; 


alarm(seconds) ; 
suspmask = oldmask; 


/* make sure SIGALRM isn't blocked */ 
sigdelset(&suspmask, SIGALRM) ; 


/* wait for any signal to be caught */ 
sigsuspend (&suspmask) ; 


/* some signal has been caught, SIGALRM is now blocked */ 
unslept = alarm(0); 


/* reset previous action */ 
sigaction(SIGALRM, &oldact, NULL); 


/* reset signal mask, which unblocks SIGALRM */ 
sigprocmask(SIG SETMASK, &oldmask, NULL); 
return (unslept); 


图 10-29 sleep 的 可 靠 实现 


与 图 10-7 相 比 ， 为 了 可 靠 地 实现 sleep， 图 10-29 的 代码 比较 长 。 程 
序 中 没有 使 用 任何 形式 的 非 局 部 转移 (如 图 10-8 中 为 了 避免 在 alarm 和 
pause 之 间 的 竞争 条 件 所 做 的 那样 ) ， 所 以 对 处 理 SIGALRM 信 号 期 间 可 
能 执行 的 其 他 信号 处 理 程序 没有 任何 影响 。 

nanosleep 函 数 与 Sleep 函数 类 似 ， 但 提供 了 纳 秒 级 的 精度 。 


#include <time.h> 


int nanosleep(const struct timespec *reqtp, struct timespec *remtp); 
REM: 者 休眠 到 要 求 的 时 间 ， 返 回 0; 大 出 错 ， 返 回 -1 

这 个 函数 挂 起 调用 进程 ， 直 到 要 求 的 时 间 已 经 超时 或 者 某 个 信和 号 
中 断 了 该 函数 。reqtp 人 参数 用 秒 和 纳 秒 指定 了 需要 休眠 的 时 间 长 度 。 如 
有 果 某 个 信号 中 断 了 休眠 间隔 ， 进 程 并 没有 终止 ，remtp 参 数 指 同 的 
timespec 结构 就 会 被 设置 为 未 休 眼 完 的 时 间 长 度 。 如 果 对 未 休 眼 完 的 时 
间 并 不 感 兴趣 ， 可 以 把 该 参数 置 为 NULL 。 

如 果 系 统 并 不 支持 纳 秒 这 一 精度 ， 要 求 的 时 间 束 会 取 整 。 因 为 
nanosleep 芳 数 并 不 涉及 产生 任何 信号 ， 所 以 不 需要 担心 与 其 他 函数 的 
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nanosleep A Ati 7; JE T Single UNIX Specification] EM} as, XI 
已 被 移 至 SUSv4 的 基础 部 分 。 

随 着 多 个 系统 时 钟 的 引入 (回忆 6.10 节 ) ， 需 要 使 用 相对 于 特定 
时 钟 的 延迟 时 间 来 挂 起 调用 线程 。clock_nanosleep 芳 数 提供 了 这 种 功 
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#include <time.h> 


int clock_nanosleep(clockid_t clock_id, int flags, 
const struct timespec *reqtp, struct timespec *remtp); 
返回 值 : 者 休眠 要 求 的 时 间 ， 返 回 0; 者 出 错 ， 返 回 错误 码 
clock id 参数 指定 了 计算 延迟 时 间 基 于 的 时 钟 。 时 钟 标 识 符 列 于 图 
6-8 中 。flags 参 数 用 于 控制 延迟 是 相对 的 还 是 绝对 的 。flags 为 0 时 表示 休 


眠 时 间 是 相对 的 (DAD, TEIBPRBRHUENIRIISUE) ， 如 果 flags 值 设置 为 
TIMER_ABSTIME， 表 示 休 有 眠 时 间 是 绝对 的 (例如 ， 希 望 休 眠 到 时 钟 
到 达 某 个 特定 的 时 间 ) 。 

其 他 的 参数 reqtp 和 remtp ， 与 nanosleep 函 数 中 的 相同 。 但 是 ， 使 用 
绝对 时 间 时 ，remtp 参 数 未 使 用 ， 因 为 没有 必要 。 在 时 钟 到 达 指 定 的 绝 
对 时 间 值 以 前 ， 可 以 为 其 他 的 clock_nanosleep 调 用 复 用 reqtp 参 数 相 同 的 
值 。 

注意 ， 除 了 出 错 返 回 ， 调 用 

clock_nanosleep(CLOCK_REALTIME, 0, reqtp, remtp); 

和 调用 

nanosleep(reqtp, remtp); 

的 效果 是 相同 的 。 使 用 相对 体 眼 的 问题 是 有 些 应 用 对 休 眼 长 度 有 
精度 要 求 ， 相 对 休眠 时 间 会 导致 实际 休眠 时 间 比 要 求 的 长 。 例 如 ， 某 
个 应 用 程序 希望 按 固定 的 时 间 间 隔 执行 任务 ， 就 必须 获取 当前 时 间 ， 
计算 下 次 执行 任务 的 时 间 ， 然 后 调用 nanosleep。 在 获取 当前 时 间 和 调 
用 nanosleep 之 间 ， 处 理 器 调度 和 抢占 可 能 会 导致 相对 休眠 时 间 超 过 实 
际 需要 的 时 间 间 隔 。 即 便 分 时 进程 调度 程序 对 休 眼 时 间 结 束 后 是 否 会 
马上 执行 用 户 任务 并 没有 给 出 保证 ， 使 用 绝对 时 间 还 是 改善 了 精度 。 

在 Single UNIX Specification 的 早期 版 本 中 ，clock_nanosleep 函 数 属 
于 时 钟 选择 选项 ， 在 SUSv4 中 ， 该 男 数 已 移 至 基础 部 分 。 


10.20 图 数 sigqueue 


在 10.8 方 中， 我 们 介绍 了 大 部 分 UNIX 系 统 不 对 信号 排队 。 
POSIX.1 的 实时 扩展 中 ， 有 些 系统 开始 增加 对 信和 号 排队 的 文 持 。 
SUSv4 中 ， 排 队 信号 功能 已 从 实时 扩展 部 分 移 至 基础 说 明 部 分 。 
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通常 一 个 信号 带 有 一 个 位 信息 : 信号 本 身 。 除 了 对 信号 排队 以 
Sey LASERS (EH 1710.14 
T) 。 这 些 信 息 众 入 在 siginfo 结 构 中 。 除 了 系统 提供 的 信息 ， 应 用 程序 
还 可 以 向 信号 处 理 程 序 传递 整数 或 者 指向 包含 更 多 信息 的 缓冲 区 指 
LAE 

使 用 排队 信号 必须 做 以 下 几 个 操作 。 

(1) 使 用 sigaction 函 数 安 装 信 本 SIGINFO 标 
志 。 如 有 果 没 有 给 出 这 个 标志 ， 信 和 号 会 延迟 ， 但 信号 是 否 进入 队列 要 取 
决 于 具体 实现 。 

(2) 在 sigaction 结 构 的 sa_sigaction 成 员 中 (而 不 是 通常 的 
sa handler Et) 提供 信号 处 理 程序 。 实 现 可 能 允许 用 户 使 用 sa_handler 
字段 ， 但 不 能 获取 sigqueue 函 数 发 送出 来 的 额外 信息 。 

(3) fi HsigqueueER ZA X 5 o 


#include <signal.h> 


P. 


int sigqueue(pid t pid, int signo, const union sigval value); 
返回 值 : ARH, GRO; EE, we- 
sigqueue 函 数 只 能 把 信号 发 送 给 单个 进程 ， 可 以 使 用 value 参 数 同 信 
号 处 理 程序 传递 整数 和 指针 值 ， 除 此 之 外 ，sigqueue 函 数 与 ki 函数 类 
似 。 


不 能 被 无 限 排队 。 回 忆 图 2-9 和 图 2-11 中 的 SIGQUEUE_MAX 
限制 。 到 达 相 应 的 限制 以 后 ，sigqueue 就 会 失败 ， 将 ermno 设 为 
EAGAIN ° 
随 着 实时 信号 的 增强 ， 引 入 了 用 于 应 用 程序 的 独立 信号 集 。 这 些 
言 号 的 编号 在 SIGRTMIN~SIGRTMAX 之 间 ， 包 括 这 两 个 限制 值 。 注 
意 ， 这 些 信号 的 默认 行为 是 终止 进程 。 
图 10-30 总 结 了 排队 信和 号 在 本 书 不 同 的 实现 中 的 行为 上 的 差异 。 


Mac OS X 10.6.8 并 不 文 持 sigqueue 或 者 实时 信号 。 在 Solaris 107, 
sigqueue 在 实时 库 librt 中 。 


FreeBSD Linux Mac OS Solaris 
8.0 3.2.0 X 10.6.8 10 


支持 sigqueue 
对 在 SIGRTMIN 和 SIGRTMAX 之 外 的 信号 排队 
即使 调用 者 没 使 用 SA_SIGINFO 标志 ， 也 对 信号 排队 


图 10-30 不 同 平 台 上 排队 信号 的 行为 


10.21 作业 H 


在 图 10-1 所 示 的 信号 中 ，POSIX.1 认 为 有 以 下 6 个 与 作业 控制 有 
关 。 

SIGCHLD 子 进程 已 停止 或 终止 。 

SIGCONT 如 采 进 程 已 停止 ， 则 使 其 继续 运行 。 

SIGSTOP 停止 信号 (不 能 被 捕捉 或 忽略 ) 。 

SIGTSTP 交互 式 停止 信号 。 

SIGTTIN 后 台 进 程 组 成 员 读 控制 终端 。 

SIGTTOU 后 台 进 程 组 成 员 写 控制 终端 。 

除 SIGCHLD 以 外 ， 大 多 数 应 用 程序 并 不 处 理 这 些 信 和 号， 交互 式 
shell 则 通常 会 处 理 这 些 信号 的 所 有 工作 。 当 链 入 挂 起 字符 (通常 是 
Ctrl+Z) 时 ，SIGTSTP 被 送 至 前 台 进 程 组 的 所 有 进程 。 当 我 们 通知 shell 
在 前 台 或 后 台 恢 复 运 行 一 个 作业 时 ，shell 向 该 作业 中 的 所 有 进程 发 送 
SIGCONT 信 和 号。 与 此 类 似 ， 如 采 问 一 个 进程 递送 了 SIGTTIN 或 
SIGTTOU 信 号 ， 则 根据 系统 默认 的 方式 ， 停 止 此 进程 ， 作 业 控 制 shell 
了 解 到 这 一 点 后 就 通知 我 们 。 


一 个 例外 是 管理 终端 的 进程 ， 例 如 ，vi(D 编 辑 锅 。 当 用 户 要 挂 起 
它 时 ， 它 需要 能 了 解 到 这 一 点 ， 这 样 就 能 将 终端 状态 恢复 到 vi 启动 时 
的 情况 。 男 外 ， 当 在 前 台 恢 复 它 时 ， 它 需要 将 终端 状态 设置 回 它 所 希 
望 的 状态 ， 并 需要 重新 绘制 终端 屏幕 。 可 以 在 下 面 的 例子 中 观察 到 与 
vi 类 似 的 程序 是 如 何 处 理 这 种 情况 的 。 

在 作业 控制 信号 间 有 某 些 交互 。 当 对 一 个 进程 产生 4 种 停止 信号 
(SIGTSTP、SIGSTOP、SIGTTIN 或 SIGTTOU) 中 的 任意 一 种 时 ， 对 
该 进程 的 任 一 未 决 SIGCONT 信 号 束 被 丢弃。 与 此 类 似 ， 当 对 一 个 进程 
产生 SIGCONT 信 号 时 ， 对 同一 进程 的 任 一 未 决 停止 信号 被 丢弃 。 

注意 ， 如 果 进 程 是 停止 的 ， 则 SIGCONT 的 默认 动作 是 继续 该 进 
程 ， 否 则 忽略 此 信和 号。 通常 ， 对 该 信号 无 需 做 任何 事情 。 当 对 一 个 停 
止 的 进程 产生 一 个 SIGCONT 信号 时 ， 该 进程 就 继续 ， 即 使 该 信号 是 被 
阻塞 或 忽略 的 也 是 如 此 。 

实例 

图 10-31 中 的 程序 演示 了 当 一 个 程序 处 理 作业 控制 时 通常 所 使 用 的 
规范 代码 序列 。 该 程序 只 是 将 其 标准 输入 复制 到 其 标准 输出 ， 而 在 信 
号 处 理 程序 中 以 注释 形式 给 出 了 管理 屏幕 的 程序 所 执行 的 典型 操作 。 


#include "apue.h" 
#define BUFFSIZE 1024 


static void 
sig_tstp(int signo) /* signal handler for SIGTSTP */ 
{ 


sigset_t mask; 


/* ... move cursor to lower left corner, reset tty mode ... */ 
/* 

* Unblock SIGTSTP, since it's blocked while we're handling it. 
zy 


sigemptyset (&mask) ; 

sigaddset (&mask, SIGTSTP); 

sigprocmask(SIG UNBLOCK, &mask, NULL); 

signal(SIGTSTP, SIG DFL); /* reset disposition to default */ 
kill(getpid(), SIGTSTP); /* and send the signal to ourself */ 
/* we won't return from the kill until we're continued */ 


signal(SIGTSTP, sig tstp); /* reestablish signal handler */ 


/* ... reset tty mode, redraw screen ... */ 


int 


main (void) 


( 


int n; 

char buf [BUFFSIZE]; 

/* 
* Only catch SIGTSTP if we're running with a job-control shell. 
*/ 

if (signal(SIGTSTP, SIG IGN) == SIG DFL) 


Signal(SIGTSTP, sig tstp); 
while ((n = read(STDIN FILENO, buf, BUFFSIZE)) > 0) 
if (write(STDOUT FILENO, buf, n) !- n) 


err sys("write error"); 


if {n< 0) 
err sys("read error"); 


exit (0); 


图 10-31 如 何 处 理 SIGTSTP 


当 图 10-31 中 的 程序 启动 时 ， 仪 当 SIGTSTP 信 号 的 配置 是 
SIG_DFL， 它 才 安 排 捕捉 该 信号 。 其 理由 是 : 当 此 程序 由 不 支持 作业 
控制 的 shell (如 /bin/sh) 启动 时 ， 此 信号 的 配置 应 当 设 置 为 SIG_IGN e 
实际 上 ，shell 并 不 显 式 地 忽略 此 信号 ， 而 是 由 init 将 这 3 个 作业 控制 信号 
SIGTSTP、SIGTTIN 和 SIGTTOU 设 置 为 SIG_IGN。 然 后 ， 这 种 配置 由 
所 有 登录 shell 继 承 。 只 有 作业 控制 shell 才 应 将 这 3 个 信号 重新 设置 为 
SIG. DFL » 

当 键 入 挂 起 字符 时 ， 进 程 接 到 SIGTSTP 信号 ， 然 后 调用 该 信号 处 
理 程序 。 此 时 ， 应 当 进 行 与 终端 有 关 的 处 理 : 将 光标 移 到 左下 角 、 恢 
复 终端 工作 方式 等 。 在 将 SIGTSTP 重 置 为 默认 值 〈 停 止 该 进程 ) ， 并 
且 解 除了 对 此 信和 号 的 阻塞 之 后 ， 进 程 向 自己 发 送 同一 信号 SIGTSTP。 
因为 正在 处 理 SIGTSTP 信和 号， 而 在 捕捉 该 信号 期 间 系 统 目 动 地 阻塞 
它 ， 所 以 应 当 解 除 对 此 信号 的 阻塞 。 到 达 这 一 点 时 ， 系 统 停止 该 进 
程 。 仅 当 某 个 进程 (通常 是 正 啊 应 一 个 交互 式 fg 命令 的 作业 控制 shell) 
向 该 进程 发 送 一 个 SIGCONT 信号 时 ， 该 进程 才 继 续 。 我 们 不 捕捉 
SIGCONT 信和 号。 该 信号 的 默认 配置 是 继续 运行 停止 的 进程 ， 当 此 发 生 
时 ， 此 程序 如 同 从 kil 函数 返回 一 样 继续 运行 。 当 此 程序 继续 运行 时 ， 
将 SIGTSTP 信 和 号 重 置 为 捕捉 ， 并 且 做 我 们 所 希望 做 的 终端 处 理 (如 重 
新 绘制 屏幕 ) 。 


10.22 信号 名 和 编号 


本 帮 介 绍 如 何在 信号 编号 和 信号 名 之 间 进 行 映 射 。 肤 些 系统 提供 
数组 
extern char *sys_siglist[]; 
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FreeBSD 8.0 ` Linux 3.2.0 和 Mac OS X 10.6.8 都 提供 这 种 信号 名 数 
组 。Solaris 10 也 提供 信号 名 数组 ， 但 该 数组 名 是 _sys_siglist。 
可 以 使 用 psignal 范 数 可 移植 地 打印 与 信号 编号 对 应 的 字符 串 。 


#include <signal.h> 


void psignal(int signo, const char *msg); 

字符 串 msg (通常 是 程序 名 ) 输出 到 标准 错误 文件 ， 后 面 跟 随 一 个 
冒号 和 一 个 空格 ， 再 后 面 对 该 信号 的 说 明 ， 最 后 是 一 个 换行 符 。 如 有 条 
msg 为 NULL， 只 有 信和 号 说 明 部 分 输出 到 标准 错误 文件 ， 该 函数 类 似 于 
perror (1.7 节 ) 。 

如 果 在 sigaction 信 号 处 理 程序 中 有 siginfo 结 构 ， 可 以 使 用 psiginfo 画 
数 打 印信 号 信息 。 

#include <signal.h> 

void psiginfo(const siginfo_t *info, const char *msg); 

它 的 工作 方式 与 psignal 函数 类 似 。 虽 然 这 个 函数 访问 除 信 号 编号 
以 外 的 更 多 信息 ， 但 不 同 的 平台 输出 的 这 些 和 额外 信息 可 能 有 所 不 同 。 

如 果 只 需要 信号 的 字符 描述 部 分 ， 也 不 需要 把 它 写 到 标准 错误 文 
件 中 (如 可 以 写 到 日 志文 件 中 ) ， 可 以 使 用 strsignal 函 数 ， 它 类 似 于 
strerror (551.758). ° 


#include <string.h> 


char *strsignal(int signo); 
返回 值 : FRA fe 7 ANE RSET 

给 出 一 个 信号 编号 ，strsignal 3X [EHE XA fa AN FF FR o Dy ARE 
序 可 用 该 字符 串 打 印 关 于 接收 到 信号 的 出 错 消 息 。 

本 书 讨论 的 所 有 平台 都 提供 psignal 和 strsignal 函 数 ， 但 相互 之 间 有 
Wy] o Æ Solaris 10 中 ， 若 信号 编号 无 效 ，strsignal 将 返回 一 个 空 指 
针 ， 而 FreeBSD 8.0 ` Linux 3.2.0 和 Mac OS X 10.6.8 则 返回 一 个 字符 
早 ， 它 指出 信号 编号 古 不 可 识别 的 。 


只 有 Linux 3.2.0 和 Solaris 10 3: ##psiginfo HW AX ° 

Solaris 提 供 一 对 函数 ， 一 个 函数 将 信号 编号 映 冉 为 信号 名 ， 男 一 个 
则 反之 。 

#include <signal.h> 

int sig2str(int signo, char *str); 

int str2sig(const char *str, int *signop); 

两 个 画 数 的 返回 值 ， 奎 成功， 返回 0; 者 出错， 返回 -1 

在 编写 交互 式 程序 ， 其 中 需 接 收 和 打印 信号 名 和 信和 号 编号 时 ， 这 
两 个 函数 是 有 用 的 。 

sig2str 函 数 将 给 定 信号 编号 翻译 成 字符 串 ， 并 将 结 采 存放 在 str 指 回 
的 存储 区 。 调 用 者 必须 保证 该 存储 区 足够 大 ， 可 以 保存 最 长 字符 串 ， 
包括 终止 null 4 P © Solaris Æ «signalh» "P E, & T % E 
SIG2STR MAX, EEC TRAFA RIE 9 ATI ELE “SIG” 
Bi ZRH f m o AUM, SIGKILL AMA EN FFB KILL”, FP Estr 
te TAA ETF ° 

str2sig 函数 将 给 出 的 信号 名 翻译 成 信号 编号 。 该 信号 编号 存放 在 
signop 指 回 的 整 型 中 。 和 名 字 要 么 是 不 市 “SIG? 前 绥 的 信号 名 ， 要 么 是 表 
示 十 进 制 信号 编号 的 字符 串 (如 “9”) 。 

注意 ，sig2str 和 str2sig 与 常用 的 函数 做 法 不 同 ， 当 它们 失败 时 ， 并 
不 设置 errno ° 


10.23 小 结 


信号 用 于 大 多 数 复杂 的 应 用 程序 中 。 理 解 进行 信号 处 理 的 原因 和 
方式 对 于 高 级 UNIX 编 程 极 其 重要 。 本 章 对 UNIX 信 和 号 进行 了 详细 而 且 
比较 深入 的 介绍 。 首 先 说 明了 早期 信号 实现 的 问题 以 及 它们 是 如 何 显 


现 出 来 的 。 然 后 介绍 了 POSIX.1 的 可 靠 信 号 概念 以 及 所 有 相关 的 函数 。 
在 此 基础 上 提供 了 abort、system 和 和 sleep 函数 的 POSIX.1 实 现 。 最 后 以 观 
察 分 析 作 业 控 制 信号 以 及 信号 名 和 信号 编号 之 间 的 转换 结束 。 


习题 


10.1 删除 图 10-2 程 序 中 的 for(;;) 语 句 ， 结 果 会 怎样 ? 为 什么 ? 

10.2 实现 10.22 节 中 说 明 的 sig2str 函 数 。 

10.3 画 出 运行 图 10-9 程 序 时 的 栈 帧 情况 。 

10.4 图 10-11 程 序 中 利用 setjmp 和 longjmp 设 置 /O 操 作 的 超时 ， 下 面 
的 代码 也 常见 用 于 此 种 目的 : 

signal(SIGALRM, sig_alrm); 

alarm(60); 

if (setjmp(env. alrm) != 0) 1 


/* handle timeout */ 
} 


这 段 代 码 有 什么 错误 ? 

10.5 仅 使 用 一 个 定时 器 (alarm 或 较 高 精度 的 setitimer) ， 构 造 一 组 
函数 ， 使 得 进程 在 该 单一 定时 需 基 础 上 可 以 设置 任 一 数量 的 定时 器 。 

10.6 编写 一 段 程序 测试 图 10-24 中 父 进程 和 子 进 程 的 同步 范 数 ， 要 
求 进程 创建 一 个 文件 并 向 文件 写 一 个 整数 0， 人 然后， 进程 调用 fork， 接 
着 ， 父 进程 和 子 进 程 交 蔡 增 加 文件 中 的 计数 器 值 ， 每 次 计数 器 值 增加 1 
上 时， 打印 是 哪 一 个 进程 〈 子 进程 或 父 进程 ) 进行 了 该 增加 1 操作 。 


10.7 在 图 10-25 中 ， 若 调用 者 捕捉 了 SIGABRT 并 从 该 信号 处 理 程序 
中 返回 ， 为 什么 不 是 仅仅 调用 _exit， 而 要 恢复 其 默认 设置 并 再 次 调用 
kill? 

10.8 为 什么 在 siginfo 结 构 (7.10.14 5) 的 si_uid 字 段 中 包括 实际 用 
户 ID 而 非 有 效用 户 ID? 

10.9 重 写 图 10-14 中 的 函数 ， 要 求 它 处 理 图 10-1 中 的 所 有 信号， 
次 循环 处 理 当 前 信号 屏蔽 字 中 的 一 个 信号 (并 不 是 对 每 一 个 可 能 的 信 
号 都 循环 一 次 ) 。 

10.10 编写 一 段 程序 ， 要 求 在 一 个 无 限 循环 中 调用 sleep(60) 函 数 ， 
每 5 分 钟 〈 即 5 次 循环 ) 取 当 前 的 日 期 和 时 间 ， 并 打印 tm_sec 字 段 。 将 程 
序 执行 一 晚上 ， 请 解释 其 结果 。 有 些 程序 ， 如 cron 守 护 进程 ， 每 分 钟 运 
行 一 次 ， 它 是 如 何 处 理 这 类 工作 的 ? 

10.11 修改 图 3-5 的 程序 ， 要 求 : (a) 将 BUFFSIZE 改 为 100; (b) 
用 signal_intr 夯 数 捕 捉 SIGXFSZ 信 号 量 并 打印 消 恩 ， 然 后 从 信号 处 理 程 
序 中 返回 ， (c) 如 果 没 有 写 满 请 求 的 字 节 数 ， 则 打印 write 的 返回 值 。 
将 软 资源 限制 RLIMIT_FSIZE ( 见 7.11 节 ) 更 改 为 1 024 字 节 (在 shell 中 
设置 软 资 源 限制 ， 如 果 不 行 就 直接 在 程序 中 调用 setrlimit) ， 然 后 复制 
一 个 大 于 1 024 字 节 的 文件 ， 在 各 种 不 同 的 系统 上 运行 新 程序 ， 其 结果 
如 何 ? 为 什么 ? 

10.12 编写 一 段 调用 fwrite 的 程序 ， 它 使 用 一 个 较 大 的 缓冲 区 ( 约 1 
GB) ， 调 用 fwrite 前 调用 alarm 使 得 1 s 以 后 产生 信号 。 在 信号 处 理 程 序 
中 打印 捕捉 到 的 信和 号， 然后 返回 。fwrite 可 以 完成 吗 ? 结果 如 何 ? 


BUE 线程 


11.1 引言 


在 前 面 的 章节 中 讨论 了 进程 ， 学 习 了 UNIX 进 程 的 环境 、 进 程 间 的 
关系 以 及 控制 进程 的 不 同方 式 。 可 以 看 到 在 相关 的 进程 间 可 以 存在 一 
定 的 共享 。 

本 章 将 进一步 深入 理解 进程 ， 了 解 如 何 使 用 多 个 控制 线程 (或 者 
简单 地 说 就 是 线程 ， 在 单 进程 环境 中 执行 多 个 任务 。 一 个 进程 中 的 所 
有 线程 都 可 以 访问 该 进程 的 组 成 部 件 ， 如 文件 摘 述 符 和 内 人 存 。 

不 管 在 什么 情况 下 ， 只 要 单个 资源 需要 在 多 个 用 户 间 共享 ， 束 必 
须 处 理 一 致 性 问题 。 本 章 的 最 后 将 讨论 目前 可 用 的 同步 机 制 ， 防 止 多 
个 线程 在 共享 资源 时 出 现 不 一 致 的 问题 。 


11.2 线程 概念 


典型 的 UNIX 进 程 可 以 看 成 只 有 一 个 控制 线程 : 一 个 进程 在 菜 一 时 
刻 只 能 做 一 件 事 情 。 有 了 多 个 控制 线程 以 后 ， 在 程序 设计 时 就 可 以 把 
进程 设计 成 在 某 一 时 刻 能 够 做 不 止 一 件 事 ， 每 个 线程 处 理 各 目 独 立 的 
任务 。 这 种 方法 有 很 多 好 处 。 


"通过 为 每 种 事件 类 型 分 配 单 独 的 处 理 线程 ， 可 以 人 简化 处 理 异 步 事 
件 的 代码 。 每 个 线程 在 进行 事件 处 理 时 可 以 采用 同步 编程 模式 ， 同 步 
编程 模式 要 比 异 步 编 程 模 式 位 和 单 得 多 。 

"多 个 进程 必须 使 用 操作 系统 提供 的 复杂 机 制 才能 实现 内 存 和 文件 
描述 符 的 共享 ， 我 们 将 在 第 15 章 和 第 17 章 中 学 习 这 方面 的 内 容 。 而 
多 个 线程 目 动 地 可 以 访问 相同 的 存储 地 址 空间 和 文件 质 述 符 。 

“有 些 问 题 可 以 分 解 从 而 提高 整个 程序 的 吞吐 量 。 在 只 有 一 个 控制 
线程 的 情况 下 ， 一 个 单线 程 进程 要 完成 多 个 任务 ， 只 需要 把 这 些 任 务 
串 行 化 。 但 有 多 个 控制 线程 时 ， 相 互 独立 的 任务 的 处 理 就 可 以 交叉 进 
行 ， 此 时 只 需要 为 每 个 任务 分 配 一 个 单独 的 线程 。 当 然 只 有 在 两 个 任 
务 的 处 理 过 程 互 不 依赖 的 情况 下 ， 两 个 任务 才 可 以 交叉 执行 。 

“交互 的 程序 同样 可 以 通过 使 用 多 线程 来 改善 啊 应 时 间 ， 多 线程 可 
以 把 程序 中 处 理 用 户 输入 输出 的 部 分 与 其 他 部 分 分 开 。 

有 些 人 把 多 线程 的 程序 设计 与 多 处 理 器 或 多 核 系统 联系 起 来 。 但 
是 即使 程序 运行 在 单 处 理 嚣 上， 也 能 得 到 多 线程 编程 模型 的 好 处 。 处 
理 器 的 数量 并 不 影响 程序 结构 ， 所 以 不 管 处 理 器 的 个 数 多 少 ， 程 序 都 
可 以 通过 使 用 线程 得 以 简化 。 而 且 ， 即 使 多 线程 程序 在 串 行 化 任务 时 
不 得 不 阻塞 ， 由 于 某 些 线程 在 阻塞 的 时 候 还 有 男 外 一 些 线程 可 以 运 
行 ， 所 以 多 线程 程序 在 单 处 理 器 上 运行 还 是 可 以 改善 啊 应 时 间 和 吞吐 


EA 


里 


每 个 线程 都 包含 有 表示 执行 环境 所 必需 的 信息 ， 其 中 包括 进程 中 
标识 线程 的 线程 ID、 一 组 寄存 器 值 、 栈 、 调 度 优先 级 和 策略 、 信 和 号 屏 
WF ` ermo (011.775) 以 及 线程 私有 数据 ( 见 12.6 8) 。 一 个 进 
程 的 所 有 信息 对 该 进程 的 所 有 线程 都 是 共享 的 ， 包 括 可 执行 程序 的 代 
码 、 程 序 的 全 局 内 存 和 堆 内 存 、 栈 以 及 文件 描述 符 。 

我 们 将 要 讨论 的 线程 接口 来 自 POSIX.1-2001。 线 程 接口 也 称 为 
“pthread” 或 “POSIX 线 程 "， 原 来 在 POSIX.1-2001 中 是 一 个 可 选 功能 ， 但 


后 来 SUSv4 把 它们 放 入 了 基本 功能 。POSIX 线 程 的 功能 测试 宏 是 
_POSIX_THREADS。 应 用 程序 可 以 把 这 个 宏 用 于 ##fdef 测 试 ， 从 而 在 
编译 时 确定 是 否 支 持 线 程 ， 也 可 以 把 _SC_THREADS 常 数 用 于 调用 
sysconf 落 数 ， 进 而 在 运行 时 确定 是 否 文 持 线程 。 尊 人 循 SUSv4 的 系统 定 
义 符号 _POSIX_THREADS 的 值 为 200809L 。 


11.3 线程 标识 


殉 像 每 个 进程 有 一 个 进程 ID 一 样 ， 每 个 线程 也 有 一 个 线程 ID。 进 
程 ID 在 整个 系统 中 是 唯一 的 ， 但 线程 ID 不 同 ， 线 程 ID 只 有 在 它 所 属 的 
进程 上 下 文中 才 有 意义 。 

回忆 一 下 进程 ID， 它 是 用 pid_t 数 据 类 型 来 表示 的 ， 是 一 个 非 负 整 
数 。 线 程 ID 是 用 pthread_t 数 据 类 型 来 表示 的 ， 实 现 的 时 候 可 以 用 一 个 结 
构 来 代表 pthread_t 数 据 类 型 ， 所 以 可 移植 的 操作 系统 实现 不 能 把 它 作 为 
整数 处 理 。 因 此 必须 使 用 一 个 函数 来 对 两 个 线程 ID 进 行 比较 。 

#include <pthread.h> 

int pthread_equal(pthread_t tid1, pthread_t tid2); 

返回 值 : AWS, EEUE; 否则 ， 返 回 0 

Linux 3.2.0 使 用 无 符号 长 整 型 表示 pthread _t 数 据 类 型 。Solaris 10 把 
pthread_t 数 据 类 型 表示 为 无 符号 整 型 。FreeBSD 8.0 和 Mac OS X 10.6.8 
用 一 个 指 问 pthread 结 构 的 指针 来 表示 pthread_t 数 据 类 型 。 

用 结构 表示 pthread_t 数 据 类 型 的 后 果 是 不 能 用 一 种 可 移植 的 方式 打 
印 该 数据 类 型 的 值 。 在 程序 调试 过 程 中 打印 线程 ID 有 时 是 非常 有 用 
的 ， 而 在 其 他 情况 下 通常 不 需要 打印 线程 ID。 最 坏 的 情况 是 ， 有 可 能 
出 现 不 可 移植 的 调试 代码 ， 当 然 这 也 算 不 上 有 是 很 大 的 局 限 性 。 

线程 可 以 通过 调用 pthread_self 函 数 获得 自身 的 线程 ID © 


#include <pthread.h> 
pthread_t pthread_self(void); 


返回 值 : 调用 线程 的 线程 ID 

当 线 程 需 要 识别 以 线程 DD 作为 标识 的 数据 结构 时 ，pthread_self 芳 
数 可 以 与 pthread_equal 函 数 一 起 使 用 。 例 如 ， 主 线程 可 能 把 工作 任务 放 
在 一 个 队列 中 ， 用 线程 ID 来 控制 每 个 工作 线程 处 理 哪些 作业 。 如 图 11-1 
所 示 ， 主 线程 把 新 的 作业 放 到 一 个 工作 队列 中 ， 由 3 个 工作 线程 组 成 的 
线程 池 从 队列 中 移出 作业 。 主 线程 不 允许 每 个 线程 任意 处 理 从 队列 顶 
端 取 出 的 作业 ， 而 是 由 主线 程控 制作 业 的 分 配 ， 主 线程 会 在 每 个 待 处 
理 作 业 的 结构 中 放置 处 理 该 作业 的 线程 ID， 每 个 工作 线程 


有 目 己 线程 ID 的 作业 。 
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图 11-1 工作 队列 实例 


11.4 线程 创建 


在 传统 UNIX 进 程 模型 中 ， 每 个 进程 只 有 一 个 控制 线程 。 从 概念 上 
讲 ， 这 与 基于 线程 的 模型 中 每 个 进程 只 包含 一 个 线程 是 相同 的 。 在 
POSIX 线 程 (pthread) 的 情况 下 ， 程 序 开 始 运 行 时 ， 它 也 是 以 单 进 程 
中 的 单个 控制 线程 启动 的 。 在 创建 多 个 控制 线程 以 前 ， 程 序 的 行为 与 
传统 的 进程 并 没有 什么 区 别 。 新 增 的 线程 可 以 通过 调用 pthread_create 画 
数 创建 。 

#include <pthread.h> 

int pthread_create(pthread_t *restrict tidp, 

const pthread_attr_t *restrict attr, 
void *(*start_rtn)(void *), void *restrict arg); 
REE: ERD, RElo; 否则 ， 返 回 错误 编号 

当 pthread_create 成 功 返 回 时 ， 新 创建 线程 的 线程 ID 会 被 设置 成 tidp 
指 癌 的 内 存单 元 。attr 参 数 用 于 定制 各 种 不 同 的 线程 属性 。 我 们 将 在 
12.3 下 中 讨论 线程 属性 ， 但 现在 我 们 把 它 置 为 NULL， 创 建 一 个 具有 默 
认 属 性 的 线程 。 

新 创建 的 线程 从 start_rtn 画 数 的 地 址 开始 运行 ， 该 画 数 只 有 一 个 无 
类 型 指针 参数 arg。 如 果 需 要 癌 start_rtn 函 数 传递 的 参数 有 一 个 以 上 ， 那 
么 需要 把 这 些 参数 放 到 一 个 结构 中 ， 然 后 把 这 个 结构 的 地 址 作为 arg 参 
BURA ° 

线程 创建 时 并 不 能 保证 哪个 线程 会 先 运 行 : 是 新 创建 的 线程 ， 还 
是 调用 线程 。 新 创建 的 线程 可 以 访问 进程 的 地 址 空间 ， 并 且 继 承 调 用 
线程 的 浮 点 环境 和 信号 屏蔽 字 ， 但 是 该 线程 的 挂 起 信号 集会 被 清除 。 

注意 ，pthread 函数 在 调用 失败 时 通常 会 返回 错误 码 ， 它 们 并 不 像 
其 他 的 POSIX 函数 一 样 设置 errno。 每 个 线程 都 提供 ermo 的 副本 ， 这 只 
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更 为 清晰 整洁 ， 不 需要 依赖 那些 随 着 函数 执行 不 断 变 化 的 全 局 状态 ， 
这 样 可 以 把 错误 的 范围 限制 在 引起 出 错 的 函数 中 。 

实例 

虽然 没有 可 移植 的 打印 线程 ID 的 方法 ， 但 是 可 以 写 一 个 小 的 测试 
程序 来 完成 这 个 任务 ， 以 便 更 深入 地 了 解 线程 是 如 何 工作 的 。 图 11-2 
中 的 程序 创建 了 一 个 线程 ， 打 印 了 进程 ID、 新 线程 的 线程 ID 以 及 初始 
线程 的 线程 ID ° 


#include "apue.h" 
#include <pthread.h> 


pthread t ntid; 


void 
printids(const char *s) 
{ 
pid t pid; 
pthread_t tid; 


pid = getpid(); 
tid = pthread_self(); 
printf("$s pid $1u tid %lu (0x%1x)\n", s, (unsigned long)pid, 
(unsigned long)tid, (unsigned long)tid); 
} 


void * 

thr_fn(void *arg) 

{ 
printids("new thread: "); 
return((void *)0); 


} 


int 


main (void) 


err = pthread_create(&ntid, NULL, thr_fn, NULL); 
if (err != 0) 

err exit(err, "can't create thread"); 
printids("main thread:"); 
sleep(1); 
exit(0); 


图 11-2 打印 线程 ID 
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Po (我 们 将 在 这 章 后 面 的 内 容 中 学 习 如 何 更 好 地 处 理 这 种 竞争 。) 
第 一 个 特别 之 处 在 于 ， 主 线程 需要 休眠 ， 如 果 主 线程 不 休眠 ， 它 就 可 
能 会 退出 ， 这 样 新 线程 还 没有 机 会 运行 ， 整 个 进程 可 能 吏 已 经 终止 
。 这 种 行为 特征 依赖 于 操作 系统 中 的 线程 实现 和 调度 算法 。 

第 二 个 特别 之 处 在 于 新 线程 是 通过 调用 pthread_self 函 数 获取 目 己 
的 线程 ID 的 ， 而 不 是 从 共享 内 存 中 读 出 的 ， 或 者 从 线程 的 局 动 例 程 中 
以 参数 的 形式 接收 到 的 。 回 忆 pthread_create 男 数 ， 它 会 通过 第 一 个 参 
数 (tidp) 返回 新 建 线程 的 线程 ID。 在 这 个 例子 中 ， 主 线程 把 新 线程 ID 
存放 在 ntid 中 ， 但 是 新 建 的 线程 并 不 能 安全 地 使 用 它 ， 如 有 果 新 线程 在 
主线 程 调 用 pthread_create 返 回 之 前 承运 行 了 ， 那 么 新 线程 看 到 的 是 未 经 
初始 化 的 ntid 的 内 容 ， 这 个 内 容 并 不 是 正确 的 线程 ID © 

在 Solaris 上 运行 图 11-2 中 的 程序 ， 得 到 : 

$ ./a.out 

main thread: pid 20075 tid 1 (0x1) 

new thread: pid 20075 tid 2 (0x2) 

正如 我 们 期 望 的 ， 两 个 线程 的 进程 站 相同 ， 但 线程 ID 不 同 。 在 
FreeBSD 上 运行 图 11-2 中 的 程序 ， 得 到 : 

$ ./a.out 

main thread: pid 37396 tid 673190208 (0x28201140) 

new thread: pid 37396 tid 673280320 (0x28217140) 

也 如 我 们 期 望 的 ， 两 个 线程 有 相同 的 进程 ID。 如 果 把 线程 ID 看 成 
是 十 进 制 整数 ， 那 么 这 两 个 值 看 起 来 很 奇怪 ， 但 是 如 果 把 它们 转化 成 

-六 进 制 ， 看 起 来 束 更 合理 了 。 束 像 前 面 提 到 的 ，FreeBSD 使 用 指向 线 

程 数据 结构 的 指针 作为 它 的 线程 ID 。 

我 们 期 望 Mac OS X 与 FreeBSD 相 似 ， 但 事实 上 ， 在 Mac OS XH, 
主线 程 ID 与 用 pthread_create 新 创建 的 线程 的 线程 ID 不 在 相同 的 地 址 苑 


di 


围 内 : 

$ ./a.out 

main thread: pid 31807 tid 140735073889440 (0x7fff70162ca0) 

new thread: pid 31807 tid 4295716864 (0x1000b7000) 

相同 的 程序 在 Linux 上 运行 得 到 : 

$ ./a.out 

main thread: pid 17874 tid 140693894424320 (0x7ff5d9996700) 

new thread: pid 17874 tid 140693886129920 (0x7ff5d91ad700) 

尽管 Linux 线 程 ID 是 用 无 符号 长 整 型 来 表示 的 ， 但 是 它们 看 起 来 像 
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Linux 2.4 FI Linux 2.6 在 线程 实现 上 是 不 同 的 。Linux 2.47, 
LinuxThreads 是 用 单独 的 进程 实现 每 个 线程 的 ， 这 使 得 它 很 难 与 POSIX 
线程 的 行为 匹配 。Linux 2.6 中 ， 对 Linux 内 核 和 线程 库 进 行 了 很 大 的 修 
改 ， 采 用 了 一 个 称 为 Native POSIX 线 程 库 (Native POSIX Thread 
Library，NPTL) 的 新 线程 实现 。 它 支持 单个 进程 中 有 多 个 线程 的 模 
型 ， 也 更 容易 支持 POSIX 线 程 的 语义 。 


11.5 线程 终止 


如 果 进 程 中 的 任意 线程 调用 了 exit、_Exit 或 者 _exit， 那 么 整个 进 
程 就 会 终止 。 与 此 相 类 似 ， 如 果 默 认 的 动作 是 终止 进程 ， 那 么 ， 发 送 
到 线程 的 信号 就 会 终止 整个 进程 (12.8 节 将 讨论 信号 与 线程 间 是 如 何 交 
互 的 ) 

单个 线程 可 以 通过 3 种 方式 退出 ， 因 此 可 以 在 不 终止 整个 进程 的 情 
况 下 ， 停 止 它 的 控制 流 。 


(1) 线程 可 以 简单 地 从 启动 例 程 中 返回 ， 返 回 值 是 线程 的 退出 


(2) 线程 可 以 被 同一 进程 中 的 其 他 线程 取消 。 
(3) 线程 调用 pthread_exit ° 

#include <pthread.h> 

void pthread exit(void *rval ptr); 

rval ptr Zt — DERAHE, A PEERS BIER ES] SR RECS 
似 。 进 程 中 的 其 他 线程 也 可 以 通过 调用 pthread_ join 函数 访问 到 这 个 指 
$e 

#include <pthread.h> 

int pthread_join(pthread_t thread, void **rval_ptr); 

返回 值 : AAC, Eo; 否则 ， 返 回 错误 编号 

调用 线程 将 一 直 阻 塞 ， 直 到 指定 的 线程 调用 pthread_exit、 从 局 动 
例 程 中 返回 或 者 被 取消 。 如 果 线 程 人 简单 地 从 它 的 局 动 例 程 返 回 ， 
rval_ptr 束 包含 返回 码 。 如 果 线 程 被 取消 ， 由 rval_ptr 指 是 的 内 存单 元 整 
设置 为 PTHREAD_CANCELED ° 

可 以 通过 调用 pthread_join 自 动 把 线程 置 于 分 离 状 态 (马上 就 会 讨 
论 到 ) ， 这 样 资源 就 可 以 恢复 。 如 果 线 程 已 经 处 于 分 离 状态 ， 
pthread_join 调 用 就 会 失败 ， 返 回 EINVAL， 尺 管 这 种 行为 是 与 具体 实现 
相关 的 。 

如 果 对 线程 的 返回 值 并 不 感 兴 趣 ， 那 么 可 以 把 rval_ptr 设 置 为 
NULL 。 在 这 种 情况 下 ， 调 用 pthread_join 函 数 可 以 等 待 指定 的 线程 终 
止 ， 但 并 不 获取 线程 的 终止 状态 。 

实例 

图 11-3 展 示 了 如 何 获取 已 终止 的 线程 的 退出 码 。 


#include "apue.h" 
#include <pthread.h> 


void * 

thr_fnl(void *arg) 

{ 
printf ("thread 1 returning\n"); 
return((void *)1); 


void * 

thr_fn2(void *arg) 

{ 
printf ("thread 2 exiting\n"); 
pthread_exit((void *)2); 


int 
main (void) 


{ 


int err; 
pthread_t EXdl, tid25 
void *tret; 


err = pthread create(&tidl, NULL, thr_fnl, NULL); 
if (err != 0) 

err exit(err, "can't create thread 1"); 
err - pthread create(&tid2, NULL, thr fn2, NULL); 


if (err != 0) 

err exit(err, "can't create thread 2"); 
err = pthread_join(tidl, &tret); 
if (err != 0) 

err exit(err, "can't join with thread 1"); 
printf("thread 1 exit code %ld\n", (long)tret); 
err = pthread_join(tid2, &tret); 
if (err != 0) 

err_exit(err, "can't join with thread 2"); 
printf ("thread 2 exit code %ld\n", (long)tret); 
exit (0); 


运行 图 11-3 中 的 程序 ， 得 到 的 结果 是 : 
$ ./a.out 
thread 1 returning 


thread 2 exiting 


图 11-3 获得 线程 退出 状态 


thread 1 exit code 1 

thread 2 exit code 2 

可 以 看 到 ， 当 一 个 线程 通过 调用 pthread_exitj 民 出 或 者 简单 地 从 局 
动 例 程 中 返回 上 时， 进程 中 的 其 他 线程 可 以 通过 调用 pthread_join 芳 数 获 
得 该 线程 的 退出 状态 。 

pthread_create 和 pthread_exit 函 数 的 无 类 型 指针 参数 可 以 传递 的 值 不 
止 一 个 ， 这 个 指针 可 以 传递 包含 复杂 信息 的 结构 的 地 址 ， 但 是 注意 ， 
这 个 结构 所 使 用 的 内 存在 调用 者 完成 调用 以 后 必须 仍然 是 有 效 的 。 例 
如 ， 在 调用 线程 的 栈 上 分 配 了 该 结构 ， 那 么 其 他 的 线程 在 使 用 这 个 结 
构 时 内 存 内 容 可 能 已 经 改变 了 。 又 如 ， 线 程 在 目 己 的 栈 上 分 配 了 一 个 
结构 ， 然 后 把 指 癌 这 个 结构 的 指针 传 给 pthread_exit， 那 么 调用 
pthread_join 的 线程 试图 使 用 该 结构 时 ， 这 个 栈 有 可 能 已 经 被 撤销 ， 这 
块 内 存 也 已 另 作 他 用 。 

实例 

图 11-4 中 的 程序 给 出 了 用 自动 变量 (OMERE) 作为 pthread_exit 
的 参数 时 出 现 的 问题 。 


#include "apue.h" 
#include <pthread.h> 


Struct! foo i 
PIE Web, te d; 


void 
printfoo(const char *s, const struct foo *fp) 


( 


printf("$s", s); 

printf(" structure at Ox%lx\n", (unsigned long) fp); 
printf(" foo.a = $dWMn", fp->a); 

printf(" foo.b = Sd\n", fp->b); 

printf(" foo.c = %d\n", fp->c); 

printf(" foo.d = $dWMn", fp->d); 


void * 
thr fnl(void *arg) 
{ 
struct foo foo = {1, 2, 3, 4}; 


printfoo("thread 1:\n", &foo); 
pthread exit((void *)&foo); 


yord * 

thr fn2(void *arg) 

{ 
printf("thread 2: ID is %lu\n", (unsigned long) pthread_self()); 
pthread_exit((void *)0); 


int 
main (void) 
{ 


int err; 
pthread_t els trid2; 
struct foo ZED? 


err = pthread create(&tidl, NULL, thr_fn1, NULL); 
if (err !- 0) 
err exit(err, "can't create thread 1"); 
err = pthread join(tidl, (void *)&fp); 
if (err != 0) 
err exit(err, "can't join with thread 1"); 
sleep (1); 
printf ("parent starting second thread\n") ; 
err = pthread create(&tid2, NULL, thr fn2, NULL); 
if (err !- 0) 
err exit(err, "can't create thread 2"); 
sleep (1); 
printfoo("parent:\n", fp); 
exit (0); 


图 11-4 pthread_exit 参 数 的 不 正确 使 用 


在 Linux 上 运行 此 程序 ， 得 到 : 
$ ./a.out 
thread 1: 
structure at 0x7f2c83682ed0 
foo.a = 1 
foo.b = 2 


foo.c = 3 
foo.d = 4 
parent starting second thread 
thread 2: ID is 139829159933696 
parent: 
structure at 0x7f2c83682ed0 
foo.a = -2090321472 
foo.b = 32556 
foo.c = 1 
foo.d = 0 
当然 ， 运 行 结果 根据 内 存 体系 结构 、 编 译 器 以 及 线程 库 的 实现 会 
有 所 不 同 。 在 Solaris 上 的 结果 类 似 : 
$ ./a.out 
thread 1: 
structure at Oxffffffff7fOfbf30 
foo.a = 1 
foo.b = 2 
foo.c = 3 
foo.d = 4 
parent starting second thread 
thread 2: ID is 3 
parent: 
structure at Oxffffffff7fOfbf30 
foo.a = -1 
foo.b = 2136969048 
foo.c = -1 
foo.d = 2138049024 


可 以 看 到 ， 当 主线 程 访问 这 个 结构 时 ， 结 构 的 内 容 (在 线程 tid1 的 
栈 上 分 配 的) 已 经 改变 了 。 注 意 第 二 个 线程 (tid2) 的 栈 是 如 何 履 盖 第 
一 个 线程 的 栈 的 。 为 了 解决 这 个 问题 ， 可 以 使 用 全 局 结构 ， 或 者 用 
malloc 函 数 分 配 结构 。 

在 Mac OS X 上 运行 的 结 末 有 上 所 不 同 : 

$ ./a.out 

thread 1: 

structure at Ox1000b6f00 
foo.a= 1 
foo.b = 2 
foo.c = 3 
foo.d = 4 

parent starting second thread 

thread 2: ID is 4295716864 

parent: 

structure at 0x1000b6f00 

Segmentation fault (core dumped) 

在 这 种 情况 下 ， 父 进程 试图 访问 已 退出 的 第 一 个 线程 传 给 它 的 结 
构 时 ， 内 存 不 再 有 效 ， 这 时 得 到 的 是 SIGSEGV 信 号。 

FreeBSD 上 ， 父 进程 访问 内 存 时 ， 内 存 并 没有 被 履 写 ， 得 到 的 结 


是 : 
thread 1: 
structure at Oxbf9fef88 
foo.a = 1 
foo.b = 2 
foo.c = 3 
foo.d = 4 


parent starting second thread 
thread 2: ID is 673279680 
parent: 
structure at Oxbf9fef88 
foo.a- 1 
foo.b = 2 
foo.c = 3 
foo.d = 4 
虽然 线程 退出 后 ， 内 存 依然 是 完整 的 ， 但 我 们 不 能 期 望 情况 总 是 
这 样 的 。 从 其 他 平台 上 的 结果 中 可 以 看 出 ， 情 况 并 不 都 是 这 样 的 。 
线程 可 以 通过 调用 pthread_cancel 范 数 来 请 求 取 消 同一 进程 中 的 其 
他 线程 。 
#include <pthread.h> 


int pthread_cancel(pthread_t tid); 
返回 值 ， 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 

在 默认 情况 下 ，pthread_cancel 琴 数 会 使 得 由 tid 标 识 的 线程 的 行为 
表现 为 如 同调 用 了 参数 为 PTHREAD_ CANCELED 的 pthread_exit EX 
数 ， 但 是 ， 线 程 可 以 选择 忽略 取消 或 者 控制 如 何 被 取消 。 我 们 将 在 12.7 
节 中 详细 讨论 。 注 意 pthread_cancel 并 不 等 竺 线程 终止 ， 它 仅仅 提出 请 
求 。 

线程 可 以 安排 它 退出 时 需要 调用 的 函数 ， 这 与 进程 在 退出 时 可 以 
用 atexit 函 数 (0,7.375). 安排 退出 是 类 似 的 。 这 样 的 函数 称 为 线程 清理 
处 理 程序 (thread cleanup handler) 。 一 个 线程 可 以 建立 多 个 清理 处 理 
程序 。 处 理 程序 记录 在 栈 中 ， 也 就 是 说 ， 它 们 的 执行 顺序 与 它们 注册 
时 相反 。 

#include <pthread.h> 


void pthread_cleanup_push(void (*rtn)(void *), void *arg); 


void pthread cleanup pop(int execute); 
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数 调度 的 ， 调 用 时 只 有 一 个 参数 arg: 

“调用 pthread_exitby ; 
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哪 种 情况 ，pthread_cleanup_pop 都 将 删除 上 次 pthread_cleanup_push 调 用 
建立 的 清理 处 理 程序 。 

这 些 函 数 有 一 个 限制 ， 由 于 它们 可 以 实现 为 安 ， 所 以 必须 在 与 线 
程 相同 的 作用 域 中 以 匹配 对 的 形式 使 用 。pthread_cleanup_push 的 安定 
义 可 以 包含 字符 {， 这 种 情况 下 ， 在 pthread_cleanup_pop 的 定义 中 要 有 
对 应 的 匹配 字符 } 。 

实例 

图 11-5 给 出 了 一 个 如 何 使 用 线程 清理 处 理 程序 的 例子 。 虽 然 例 子 是 
人 为 编造 的 ， 但 它 描述 了 其 中 涉及 的 清理 机 制 。 注 意 ， 虽 然 我 们 从 来 
没 想 过 要 传 一 个 参数 0 给 线程 启动 例 程 ， 但 还 是 需要 把 
pthread_cleanup_pop 调 用 和 pthread_cleanup_push 调 用 匹配 起 来 ， 否 则 ， 
程序 编译 就 可 能 通 不 过 。 


#include "apue.h" 
#include <pthread.h> 


void 
cleanup (void *arg) 


{ 


printf("cleanup: %s\n", (char *)arg); 


void * 
thr fnl(void *arg) 
{ 
printf ("thread 1 start\n"); 
pthread cleanup push(cleanup, "thread 1 first handler"); 
pthread cleanup push(cleanup, "thread 1 second handler"); 
printf("thread 1 push complete\n"); 
if (arg) 
return((void *)1); 
pthread cleanup pop(0); 
pthread cleanup pop(0); 
return((void *)1); 


void * 
thr fn2(void *arg) 
( 
printf("thread 2 start Wn"); 
pthread cleanup push(cleanup, "thread 2 first handler"); 
pthread cleanup push(cleanup, "thread 2 second handler"); 
printf("thread 2 push complete Mn"); 
if (arg) 
pthread exit((void *)2); 
pthread cleanup pop(0); 
pthread cleanup pop(0); 
pthread exit((void *)2); 


int 
main (void) 
( 


int err; 
pthread t tidl, tid2; 
void *tret; 


err = pthread create(&tidl, NULL, thr fnl, (void *)1); 
if (err != 0) 

err exit(err, "can't create thread 1"); 
err = pthread create(&tid2, NULL, thr fn2, (void *)1); 
if (err !- 0) 

err exit(err, "can't create thread 2"); 
err = pthread join(tidl, &tret); 
if (err != 0) 

err exit(err, "can't join with thread 1"); 
printf("thread 1 exit code %ld\n", (long)tret); 
err = pthread join(tid2, &tret); 
if (err != 0) 

err exit(err, "can't join with thread 2"); 
printf("thread 2 exit code %ld\n", (long)tret); 
exit(0); 


图 11-5 线程 清理 处 理 程序 


在 Linux 或 者 Solaris 上 运行 图 11-5 中 的 程序 会 得 到 : 
$ ./a.out 
thread 1 start 


thread 1 push complete 

thread 2 start 

thread 2 push complete 

cleanup: thread 2 second handler 

cleanup: thread 2 first handler 

thread 1 exit code 1 

thread 2 exit code 2 

从 和 输出 结果 可 以 看 出 ， 两 个 线程 都 正确 地 局 动 和 退出 了 ， 但 是 只 
有 第 二 个 线程 的 清理 处 理 程序 被 调用 了 。 因 此 ， 如 果 线 程 是 通过 从 它 
的 启动 例 程 中 返回 而 终止 的 话 ， 它 的 清理 处 理 程序 就 不 会 被 调用 。 还 
要 注意 ， 清 理 处 理 程 序 是 按照 与 它们 安装 时 相反 的 顺序 被 调用 的 。 

WAR TE FreeBSD EY Mac OS X 上 运行 相同 的 程序 ， 可 以 看 到 程序 
会 出 现 段 异 稼 并 产生 core 文 件 。 这 是 因为 在 这 两 个 平台 上 ， 
pthread_cleanup_push 是 用 宏 实现 的 ， 而 宏 把 某 些 上 下 文 存放 在 栈 上 。 
当 线 程 1 在 调用 pthread_cleanup_push 和 调用 pthread_cleanup_pop 之 间 返 
回 时 ， 栈 已 被 改写 ， 而 这 两 个 平台 在 调用 清理 处 理 程序 时 就 用 了 这 个 
被 改写 的 上 上 下文。 在 Single UNIX Specification t, B ti R A yi H 
pthread_cleanup_push 和 pthread_cleanup_pop 之 间 返 回 ， 会 产生 未 定义 行 
为 。 唯 一 的 可 移植 方法 是 调用 pthread_exit ° 

现在 ， 证 我 们 了 解 一 下 线程 函数 和 进程 畏 数 之 间 的 相似 之 处 。 图 
11-6 总 结 了 这 些 相 似 的 函数 。 


进程 原 语 线程 原 语 


fork pthread create 创建 新 的 控制 流 
exit pthread exit 从 现 有 的 控制 流 中 退出 


waitpid pthread join 从 控制 流 中 得 到 退出 状态 
atexit pthread cancel push 注册 在 退出 控制 流 时 调用 的 函数 
getpid pthread self 获取 控制 流 的 ID 

abort pthread cancel 请 求 控 制 流 的 非 正 常 退出 


图 11-6 进程 和 线程 原 语 的 比较 

在 默认 情况 下 ， 线 程 的 终止 状态 会 保存 直到 对 该 线程 调用 
pthread_join。 如果 线程 已 经 被 分 离 ， 线 程 的 底层 存储 资源 可 以 在 线程 
终止 时 立即 被 收回 。 在 线程 被 分 离 后 ， 我 们 不 能 用 pthread_join 画 数 等 
竺 它 的 终止 状态 ， 因 为 对 分 离 状 态 的 线程 调用 pthread_join 会 产生 未 定 
义 行 为 。 可 以 调用 pthread_detach 分 离线 程 。 

#include <pthread.h> 

int pthread_detach(pthread_t tid); 

返回 值 : AAI, WO; 否则 ， 返 回 错 误 编 号 

在 下 一 半 里 ， 我 们 将 学 习 通 过 修改 传 给 pthread_create 函 数 的 线程 属 

性 ， 创 建 一 个 已 处 于 分 离 状态 的 线程 。 


11.6 线程 同步 


当 多 个 控制 线程 共 至 相同 的 内 存 时 ， 需 要 确 你 每 个 线程 看 到 一 致 
的 数据 视图 。 如 果 每 个 线程 使 用 的 变量 都 是 其 他 线程 不 会 读 取 和 修改 
的 ， 那 么 吏 不 存在 一 致 性 问题 。 同 样 ， 如 采 变 量 是 只 读 的 ， 多 个 线程 
同时 读 取 该 变量 也 不 会 有 一 致 性 问题 。 但 是 ， 当 一 个 线程 可 以 修改 的 
变量 ， 其 他 线程 也 可 以 读 取 或 者 修改 的 时 候 ， 我 们 就 需要 对 这 些 线程 
进行 同步 ， 确 保 它 们 在 访问 变量 的 存储 内 容 时 不 会 访问 到 无 效 的 值 。 


当 一 个 线程 修改 变量 时 ， 其 他 线程 在 读 取 这 个 变量 时 可 能 会 看 到 
一 个 不 一 致 的 值 。 在 变量 修改 时 间 多 于 一 个 存储 右 访 问 周 期 的 处 理 右 
结构 中 ， 当 存储 紫 读 与 存储 右 写 这 两 个 周期 交 义 时 ， 这 种 不 一 致 束 会 
出 现 。 当 然 ， 这 种 行为 是 与 处 理 紫 体系 结构 相关 的 ， 但 古 可 移植 的 程 
序 并 不 能 对 使 用 何 种 处 理 器 体系 结构 做 出 任何 假设 。 

图 11-7 搬 述 了 两 个 线程 读 写 相 同 变量 的 假设 例子 。 在 这 个 例子 
中 ， 线 程 A 读 取 变量 然后 给 这 个 变量 赋予 一 个 新 的 数值 ， 但 写 操作 和 需 
要 两 个 存储 塘 周 期 。 当 线程 B 在 这 两 个 存储 郁 写 周期 中 间 读 取 这 个 变量 
时 ， 它 束 会 得 到 不 一 致 的 值 。 

为 了 解决 这 个 问题 ， 线 程 不 得 不 使 用 锁 ， 同 一 时 间 只 允许 一 个 线 
程 访问 该 变量 。 图 11-8 摘 述 了 这 种 同步 。 如 琳 线 程 B 希 望 二 取 变量 ， 它 
首先 要 获取 锁 。 同 样 ， 当 线程 A 更 新 变量 时 ， 也 需要 获取 同样 的 这 把 
詹 。 这 样 ， 线 程 B 在 线程 A 释放 锁 以 前 束 不 能 读 取 变量 。 


线程 A 线程 B 


时 间 


247 
35 


图 11-7 两 个 线程 的 交叉 存储 器 周期 


线程 A 线程 B 


时 间 


图 11-8 两 个 线程 同步 内 存 访 问 

两 个 或 多 个 线程 试图 在 同一 时 间 修 改 同一 变量 时 ， 也 需要 进行 同 
步 。 考 虑 变量 增 量 操作 的 情况 〈 图 11-9) ， 增 量 操作 通常 分 解 为 以 下 3 
步 。 

(1) 从 内 存单 元 读 入 寄存 器 。 

(2) 在 寄存 器 中 对 变量 做 增 量 操作 。 

(3) 把 新 的 值 写 回 内 存单 元 。 


如 果 两 个 线程 试图 几乎 在 同一 时 间 对 同一 个 变量 做 增 量 操作 而 不 
进行 同步 的 话 ， 绪 采 束 可 能 出 现 不 一 致 ， 变 量 可 能 比 原 来 增加 了 1， 也 
有 可 能 比 原来 增加 了 2， 具 体 增加 了 1 还 古 2 要 取决 于 第 二 个 线程 开始 操 
作 时 获取 的 数值 。 如 有 果 第 二 个 线程 执行 第 1 步 要 比 第 一 个 线程 执行 第 3 
步 要 早 ， 第 二 个 线程 读 到 的 值 与 第 一 个 线程 一 样 ， 为 变量 加 1， 然 后 写 
回去 ， 事 实 上 没有 实际 的 效 末 ， 总 的 来 说 变量 只 增加 了 1。 

如 琳 修 改 操 作 是 原 了 于 操作， 那么 束 不 存在 竞争 。 在 前 面 的 例子 
中 ， 如 果 增 加 1 只 需要 一 个 存储 器 周期 ， 那 么 就 没有 竞争 存在 。 如 果 数 
据 总 是 以 顺序 一 致 出 现 的 ， 束 不 需要 额外 的 同步 。 当 多 个 线程 观察 不 
到 数据 的 不 一 臻 时， 那么 操作 就 是 顺序 一 致 的 。 在 现代 计算 机 系统 
中 ， 存 储 访问 需要 多 个 总 线 周 期 ， 多 处 理 器 的 忌 线 周 期 通常 在 多 个 处 
理 需 上 有 是 交叉 的 ， 所 以 我 们 并 不 能 保证 数据 是 顺序 一 致 的 。 


线程 A 线程 B i 的 内 容 


将 工 取 入 寄存 器 
(寄存 器 = 5) 


对 寄存 器 内 容 做 
增 量 操作 pere iia 5 
( 寄存 器 = 6) 
时 间 
将 寄存 器 对 寄存 器 内 容 做 
HATA i 增 量 操作 6 
( 寄存 器 = 6) (寄存 器 = 6) 
将 寄存 器 
HAA i 6 


( 寄存 器 = 6) 


图 11-9 两 个 非 同步 的 线程 对 同一 个 变量 做 增 量 操作 
在 顺序 一 致 环境 中 ， 可 以 把 数据 修改 操作 解释 为 运行 线程 的 顺序 
操作 步 又 。 可 以 把 这 样 的 操作 描述 为 “线程 A 对 变量 增加 了 1， 然 后 线程 
B 对 变量 增加 了 1， 所 以 变量 的 值 束 比 原来 的 大 2”"， 或 者 接 述 为 “线程 B 
对 变量 增加 了 1， 然 后 线程 A 对 变量 增加 了 1， 所 以 变量 的 值 整 比 原来 的 
大 2”。 这 两 个 线程 的 任何 操作 顺序 都 不 可 能 让 变量 出 现 除了 上 述 值 以 
外 的 其 他 值 。 
除了 计算 机 体系 结构 以 外 ， 程 序 使 用 变量 的 方式 也 会 引起 竞争 ， 
会 导致 不 一 致 的 情况 发 生 。 例 如 ， 我 们 可 能 对 茶 个 变量 加 1， 然 后 基 


Tu fL ICE FER AE ^ AAI TSE REPRE ZG DR AIK NR EP RAY 2H 
合并 非 原子 操作 ， 所 以 融 给 不 一 致 情况 的 出 现 提供 了 可 能 。 


11.6.1 EJF E 


可 以 使 用 pthread 的 互 斥 接口 来 保护 数据 ， 确 傈 同一 时 间 只 有 一 个 
线程 访问 数据 。 互 不 量 (mutex) 从 本 质 上 说 是 一 把 锁 ， 在 访问 共享 资 
源 前 对 互 不 量 进行 设置 ORD ， 在 访问 完成 后 释放 (解锁 ) A 
量 。 对 互 斥 量 进行 加 锁 以 后 ， 任 何其 他 试图 再 次 对 互 斥 量 加 锁 的 线程 
都 会 被 阻塞 直到 当前 线程 释放 该 互 不 锁 。 如 果 释 放 互 不 量 时 有 一 个 以 
上 的 线程 阻塞 ， 那 么 所 有 该 锁 上 的 阻塞 线程 都 会 变 成 可 运行 状态 ， 第 
一 个 变 为 运行 的 线程 就 可 以 对 互 不 量 加 锁 ， 其 他 线程 就 会 看 到 互 不 量 
依然 是 锁 着 的 ， 只 能 回去 再 次 等 待 它 重 新 变 为 可 用 。 在 这 种 方式 下 ， 
每 次 只 有 一 个 线程 可 以 向 前 执行 。 

只 有 将 所 有 线程 都 设计 成 遵守 相同 数据 访问 规则 的 ， 互 不 机 制 才 
能 正常 工作 。 操 作 系 统 并 不 会 为 我 们 做 数据 访问 的 串 行 化 。 如 采 人 允许 
其 中 的 某 个 线程 在 没有 得 到 锁 的 情况 下 也 可 以 访问 共享 资源 ， 那 么 即 
使 其 他 的 线程 在 使 用 共享 资源 前 都 申请 锁 ， 也 还 是 会 出 现 数据 不 一 致 
的 问题 。 

互 不 变量 是 用 pthread_mutex_t 数 据 类 型 表示 的 。 在 使 用 互 不 变量 以 
Bi, 必须 自 先 对 它 进 行 初始 化 ， 可 以 把 它 设 置 为 常量 
PTHREAD_MUTEX_INITIALIZER (只 适用 于 静态 分 配 的 互 不 量 ) ， 
也 可 以 通过 调用 pthread_mutex_init 范 数 进 行 初始 化 。 如 果 动 态 分 配 互 不 
量 〈 例 如 ， 通 过 调用 malloc 函 数 ) ， 在 释放 内 存 前 需要 调用 
pthread mutex destroy ° 


#include <pthread.h> 


int pthread_mutex_init(pthread_mutex_t *restrict mutex, 


const pthread, mutexattr t *restrict attr); 
int pthread. mutex destroy(pthread mutex t *mutex); 
两 个 图 数 的 返回 值 : ERD, eo; 否则 ， 返 回 错误 编号 
要 用 默认 的 属性 初始 化 互 斥 量 ， 只 需 把 attr 设 为 NULL。 我 们 将 在 
12.4 节 中 讨论 互 斥 量 属 性 。 
对 互 斥 量 进行 加 锁 ， 需 要 调用 pthread_mutex_lock。 如 果 互 斥 量 已 
经 上 锁 ， 调用 线程 将 阻塞 直到 互 斥 量 被 解 人 。 对 互 斥 量 解锁 ， 需 要 调 
用 pthread_mutex_unlock ° 
#include <pthread.h> 


int pthread_mutex_lock(pthread_mutex_t *mutex); 

int pthread_mutex_trylock(pthread_mutex_t *mutex); 

int pthread_mutex_unlock(pthread_mutex_t *mutex); 

MAKAIRE: 大 成功， 返回 0; 人 否则， 返回 错误 编号 

如 采 线 程 不 希望 被 阻 奢 ， 它 可 以 使 用 pthread_mnutex_trylock 竹 试 对 
互 斥 量 进行 加 锁 。 如 果 调 用 pthread_mutex_trylock 时 互 斥 量 处 于 未 锁 住 
状态 ， 那 么 pthread mutex _trylock 将 锁 住 互 斥 量 ， 不 会 出 现 阻 堵 直 接 返 
回 0， 和 否则 pthread_mnutex_trylock 就 会 失败 ， 不 能 锁 住 互 斥 量 ， 返 回 
EBUSY ° 

实例 

图 11-10 描 述 了 用 于 保护 某 个 数据 结构 的 互 斥 量 。 当 一 个 以 上 的 线 
程 需要 访问 动态 分 配 的 对 象 时 ， 我 们 可 以 在 对 象 中 舱 入 引用 计数 ， 确 
保 在 所 有 使 用 该 对 象 的 线程 完成 数据 访问 之 前 ， 该 对 象 内 存 空间 不 会 
BPEL ° 

在 对 引用 计数 加 1、 减 1、 检查 引用 计数 是 否 到 达 0 这 些 操作 之 前 
需要 锁 住 互 不 量 。 在 foo_alloc 函数 中 将 引用 计数 初始 化 为 工时 没 必 要 
加 锁 ， 因 为 在 这 个 操作 之 前 分 配 线程 是 唯一 引用 该 对 象 的 线程 。 但 是 


在 这 之 后 如 果 要 将 该 对 象 放 到 一 个 列表 中 ， 那 么 它 殊 有 可 能 被 别 的 线 
程 发 现 ， 这 时 候 需 要 首先 对 它 加 锁 。 

在 使 用 该 对 象 前 ， 线 程 需要 调用 foo_hold 对 这 个 对 象 的 引用 计数 加 
1。 当 对 象 使 用 完毕 时 ， 必 须 调用 foo_rele 释 放 引 用 。 最 后 一 个 引用 被 释 
放 时 ， 对 象 所 占 的 内 存 空间 束 被 释放 。 

在 这 个 例子 中 ， 我 们 忽略 了 线程 在 调用 foo_hold 之 前 是 如 何 找到 对 
象 的 。 如 果 有 另 一 个 线程 在 调用 foo_hold 时 阻塞 等 待 互 斥 锁 ， 这 时 即使 
该 对 象 引 用 计数 为 0，foo_rele 释 放 该 对 象 的 内 存 仍然 是 不 对 的 。 可 以 通 
过 确保 对 象 在 释放 内 存 前 不 会 被 找到 这 种 方式 来 避免 上 述 问 题 。 可 以 
通过 下 面 的 例子 来 看 看 如 何 做 到 这 一 点 。 


#include <stdlib.h> 
#include <pthread.h> 


struct “foo: { 


int f count; 
pthread mutex t f lock; 

int f id; 

/* ... more stuff here ... */ 


struct foo * 
foo alloc(int id) /* allocate the object */ 
{ 


Struct £00 Zp: 


if ((fp = malloc(sizeof(struct foo))) != NULL) { 
fp->f_count = 1; 
fp->f_id = id; 
if (pthread_mutex_init(&fp->f_lock, NULL) != 0) { 
free(fp); 
return (NULL); 
} 
f= iss Continue; initialization sma */ 
} 
return (fp); 


void 
foo_hold(struct foo *fp) /* add a reference to the object */ 
{ 

pthread mutex lock(&fp-»f lock); 

fp->f_count++; 

pthread mutex unlock(&fp-»f lock); 


void 
foo rele(struct foo *fp) /* release a reference to the object */ 
{ 
pthread_mutex_lock (&fp->f_lock) ; 
if (--fp->f_count == 0) { /* last reference */ 
pthread_mutex_unlock (&fp->f_lock) ; 
pthread_mutex_destroy (&fp->f_lock) ; 
free(fp); 
} else { 
pthread_mutex_unlock (&fp->f_lock) ; 


图 11-10 使 用 互 斥 量 保护 数据 结构 


11.6.2 避免 死 锁 
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锁 状态 ,但 是 使 用 互 不 量 时 ， 还 有 其 他 不 太 明 显 的 方式 也 能 产生 死 
锁 。 例 如 ， 程 序 中 使 用 一 个 以 上 的 互 不 量 时 ， 如 果 人 允许 一 个 线程 一 直 
占有 第 一 个 互 斥 量 ， 并 且 在 试图 锁 住 第 二 个 互 斥 量 时 处 于 阻塞 状态 ， 
但 是 拥有 第 二 个 互 不 量 的 线程 也 在 试图 锁 住 第 一 个 互 不 量 。 因 为 两 个 
线程 都 在 相互 请 求 男 一 个 线程 拥有 的 资源 ， 所 以 这 两 个 线程 都 无 法 癌 
前 运行 ， 于 是 就 产生 死 锁 。 

可 以 通过 仔细 控制 互 不 量 加 锁 的 顺序 来 避免 死 锁 的 发 生 。 例 如 ， 
假设 需要 对 两 个 互 不 量 A 和 B 同 时 加 锁 。 如 果 所 有 线程 总 是 在 对 互 不 量 
B 加 锁 之 前 锁 住 互 斥 量 A， 那 么 使 用 这 两 个 互 斥 量 束 不 会 产生 死 锁 ( 当 
然 在 其 他 的 资源 上 仍 可 能 出 现 死 锁 ) 。 类 似 地 ， 如 果 所 有 的 线程 总 是 
在 锁 住 互 斥 量 A 之 前 锁 住 互 斥 量 B， 那 么 也 不 会 发 生死 锁 。 可 能 出 现 的 
死 锁 只 会 发 生 在 一 个 线程 试图 锁 住 另 一 个 线程 以 相反 的 顺序 锁 住 的 互 
不 量 。 

有 时 候 ， 应 用 程序 的 结构 使 得 对 互 不 量 进行 排序 是 很 困难 的 。 如 
采 涉 及 了 太 多 的 锁 和 数据 结构 ， 可 用 的 函数 并 不 能 把 它 转 换 成 简单 的 
层次 ， 那 么 就 需要 采用 另外 的 方法 。 在 这 种 情况 下 ， 可 以 先 释 放 占 有 
的 锁 ， 然 后 过 一 段 时 间 再 试 。 这 种 情况 可 以 使 用 pthread_mutex_trylock 
接口 避免 死 锁 。 如 果 已 经 占有 某 些 锁 而 且 pthread_mnutex_trylock 接 口 返 
回 成 功 ， 那 么 就 可 以 前 进 。 但 是 ， 如 果 不 能 获取 锁 ， 可 以 先 释 放 已 经 
占有 的 锁 ， 做 好 清理 工作 ， 然 后 过 一 段 时 间 再 重新 试 。 

实例 

在 这 个 例子 中 ， 我 们 更 新 了 图 11-10 的 程序 ， 展 示 了 两 个 互 斥 量 的 
使 用 方法 。 在 同时 需要 两 个 互 斥 量 时 ， 总 是 让 它们 以 相同 的 顺序 加 
锁 ， 这 样 可 以 避免 死 锁 。 第 二 个 互 斥 量 维护 着 一 个 用 于 跟踪 foo 数 据 结 
构 的 散 列 列表 。 这 样 hashlock 互 不 量 既 可 以 保护 foo 数 据 结构 中 的 散 列 


表 和 二， 又 可 以 保护 散 列 链 字段 {_next。foo 结 构 中 的 f_lock 互 不 量 保护 对 
foo 结 构 中 的 其 他 字段 的 访问 。 


#include <stdlib.h> 
#include <pthread.h> 


#define NHASH 29 
#define HASH (id) (((unsigned long) id) $NHASH) 


struct foo *fh[NHASH]; 
pthread mutex t hashlock = PTHREAD MUTEX INITIALIZER; 


struct foo 1 


int f count; 

pthread mutex t f lock; 

int f id; 

struct foo * f next; /* protected by hashlock */ 
/* ... more stuff here ... */ 


}; 


struct foo * 
foo_alloc(int id) /* allocate the object */ 
{ 


struct foo *EDS 
int idx; 
if ((fp = malloc(sizeof(struct foo))) != NULL) { 


fp-»f count = 1; 
fp-»f id = id; 
if (pthread mutex init(&fp-»f lock, NULL) != 0) { 


free(fp); 

return (NULL); 
} 
idx = HASH(id); 
pthread mutex lock(&hashlock); 
fp->f next = fh[idx]; 
fh[idx] = fp; 
pthread_mutex_lock(&fp->f_lock) ; 
pthread mutex unlock(&hashlock); 
/* ... continue initialization ... */ 
pthread mutex unlock(&fp-»f lock); 

} 


return (fp); 


void 
foo_hold(struct foo *fp) /* add a reference to the object */ 
{ 

pthread mutex lock(&fp-»f lock); 

fp-5f countH4t; 

pthread mutex unlock(&fp-»f lock); 


struct foo * 
foo find(int id) /* find an existing object */ 
( 

struct foo *fp; 


pthread mutex lock(&hashlock); 
for (fp = fh[HASH(id)]; fp != NULL; fp = fp-»f next) { 
if (fp->f id == id) { 
foo hold(fp); 
break; 


} 
pthread mutex unlock(&hashlock); 


return(fp); 


void 
foo rele(struct foo *fp) /* release a reference to the object */ 
{ 

struct foo *tfp; 

int idx; 


pthread mutex lock(&fp-»f lock); 
if (fp->f count == 1) { /* last reference */ 
pthread mutex unlock(&fp-»f lock); 
pthread mutex lock(&hashlock); 
pthread mutex lock(&fp-»f lock); 
/* need to recheck the condition */ 
at (Ep =k caunt be 1) d 
fp->f_count--; 
pthread_mutex_unlock(&fp->f_lock) ; 
pthread mutex unlock(&hashlock); 


return; 
} 
/* remove from list */ 
idx = HASH(fp->f_id); 
tfp = fh[idx]; 
if (tfp == fp) { 
fh[idx] = fp->f_next; 
} else { 
while (tfp->f_next != fp) 
tfp = tfp->f_next; 
tfp->f_next = fp->f_next; 
} 
pthread mutex unlock(&hashlock); 
pthread mutex unlock(&fp-»f lock); 
pthread mutex destroy(&fp-»f lock); 
free (fp); 
) else { 
fp=>f..count==; 
pthread mutex unlock(&fp-»f lock); 
) 


图 11-11 使 用 两 个 互 斥 量 


比较 图 11-11 和 图 11-10， 可 以 看 出 ， 分 配 函 数 现在 锁 住 了 散 列 列 
表 锁 ， 把 新 的 结构 添加 到 了 散 列 桶 中 ， 而 且 在 对 散 列 列表 的 锁 解 锁 之 
前 ， 先 锁定 了 新 结构 中 的 互 不 量 。 因 为 新 的 结构 是 放 在 全 局 列表 中 
的 ， 其 他 线程 可 以 找到 它 ， 所 以 在 初始 化 完成 之 前 ， 需 要 阻塞 其 他 线 
程 试图 访问 新 结构 。 

foo_find 函 数 锁 住 散 列 列表 锁 ， 然 后 搜索 被 请 求 的 结构 。 如 果 找 到 
了 ， 就 增加 其 引用 计数 并 返回 指向 该 结构 的 指针 。 注 意 ， 加 锁 的 顺序 
是 ， 驳 在 foo_find 函 数 中 锁定 散 列 列表 锁 ， 然 后 再 在 foo_hold 函 数 中 锁 
定 foo 结 构 中 的 f_lock 互 不 量 。 

现在 有 了 两 个 锁 以 后 ，foo_rele 函 数 就 变 得 更 加 复杂 了 。 如 果 这 是 
最 后 一 个 引用 ， 束 需要 对 这 个 结构 互 不 量 进行 解锁 ， 因 为 我 们 需要 从 
散 列 列表 中 删除 这 个 结构 ， 这 样 才 可 以 获取 散 列 列表 锁 ， 然 后 重新 获 
取 结 构 互 不 量 。 从 上 一 次 获得 结构 互 不 量 以 来 我 们 可 能 被 阻塞 着 ， 所 
以 需要 重新 检查 条 件 ， 判 断 是 否 还 需要 释放 这 个 结构 。 如 果 男 一 个 线 
程 在 我 们 为 满足 锁 顺 序 而 阻塞 时 发 现 了 这 个 结构 并 对 其 引用 计数 加 1， 


那么 只 需要 人 简单 地 对 整个 引用 计数 减 1， 对 所 有 的 东西 解锁 ， 然 后 返 
[H] o 

这 种 锁 方 法 很 复杂 ， 所 以 我 们 需要 重新 审视 原来 的 设计 。 我 们 也 
可 以 使 用 散 列 列表 锁 来 傈 护 结构 引用 计数 ， 使 事情 大 大 人 简 化。 结构 互 
不 量 可 以 用 于 保护 foo 结 构 中 的 其 他 任何 东西 。 图 11-12 反 映 了 这 种 变 
fts 


#include <stdlib.h> 
#include <pthread.h> 


#define NHASH 29 
#define HASH (id) (((unsigned long) id) $NHASH) 


struct foo *fh[NHASH]; 
pthread mutex t hashlock - PTHREAD MUTEX INITIALIZER; 


struct foo { 
int f count; /* protected by hashlock */ 
pthread mutex t f lock; 


int fid; 
struct foo * f_next; /* protected by hashlock */ 
/* ... more stuff here ... */ 

he 


Struct foo * 
foo_alloc(int id) /* allocate the object */ 
{ 

struct foo * fp? 

int idx; 


if ((fp = malloc(sizeof(struct foo))) != NULL) { 
fp-»f count = 1; 
fp->f_id = id; 
if (pthread mutex_init (&fp->f_lock, NULL) != 0) { 
free(fp); 
return (NULL) ; 
} 
idx = HASH (id); 
pthread mutex lock(&hashlock); 
fp-»5f next = fh[idx]; 
fh[idx] = fp; 
pthread mutex lock(&fp-»f lock); 
pthread mutex unlock(&hashlock); 
/* ... continue initialization ... */ 
pthread mutex unlock(&fp-»f lock); 
) 
return(fp); 


void 
foo hold(struct foo *fp) /* add a reference to the object */ 
{ 

pthread mutex lock(&hashlock); 

fp->f_count++; 

pthread mutex unlock(&hashlock); 


struct foo * 
foo find(int id) /* find an existing object */ 
{ 

struct foo CEDE 


pthread mutex lock(&hashlock); 
for (fp = fh[HASH(id)]; fp != NULL; fp = fp->f next) { 
if (fp-»5f id == id) { 
fp->f_count++; 
break; 


} 


pthread mutex unlock(&hashlock); 
return(fp); 


void 


foo rele(struct foo *fp) /* release a reference to the object */ 
( 

struct foo *tfp; 

int idx; 


pthread mutex lock(&hashlock); 
if (--fp-»5f count == 0) { /* last reference, remove from list */ 
idx = HASH(fp-»^f id); 
tfp = fh[idx]; 
if (tfp -- fp) ( 
fh[idx] = fp->f next; 
) else { 
while (tfp->f next !- fp) 
tfp = tfp-»5f next; 
tfp-»f next = fp-^f next; 
} 
pthread mutex unlock(&hashlock); 
pthread mutex destroy(&fp-»f lock); 
free(fp); 
) else { 
pthread mutex unlock(&hashlock); 
} 


图 11-12 简化 的 锁 


注意 ， 与 图 11-11 中 的 程序 相 比 ， 图 11-12 中 的 程序 就 简单 多 了 。 两 
种 用 途 使 用 相同 的 锁 时 ， 围 绕 散 列 列表 和 引用 计数 的 锁 的 排序 问题 就 
不 存在 了 。 多 线程 的 软件 设计 涉及 这 两 者 之 间 的 折 中 。 如 果 锁 的 粒度 
太 粗 ， 束 会 出 现 很 多 线程 阻塞 等 得 相同 的 锁 ， 这 可 能 并 不 能 改善 并 发 
性 。 如 果 锁 的 粒度 太 细 ， 那 么 过 多 的 锁 开 销 会 使 系统 性 能 受到 影响 ， 
而 且 代 码 变 得 复杂 。 作 为 一 个 程序 员 ， 需 要 在 满足 锁 需求 的 情况 下 ， 
在 代码 复杂 性 和 性 能 之 间 找 到 正确 的 平衡 。 


11.6.3 图 数 pthread_mutex_timedlock 


当 线 程 试 图 获取 一 个 已 加 锁 的 互 不 量 时 ，pthread_mutex_timedlock 
H fe R A fo YE SEE RIE SE FY [is] ^ pthread_mutex_timedlock Ex Zi 5 
pthread_mutex_lock 是 基本 等 价 的 ， 但 是 在 达到 超时 时 间 值 时 ， 


pthread mutex timedlock /^ A X A Fe xt JE BA, T de 3x [pl $8 Vx 13 
ETIMEDOUT ° 


#include <pthread.h> 


#include <time.h> 


int pthread_mutex_timedlock(pthread_mutex_t *restrict mutex, 
const struct timespec *restrict tsptr); 

返回 值 : ERD, Reo; 否则 ， 返 回 错误 编号 
超时 指定 愿意 


Jos 
等 待 的 绝对 时 间 (与 相对 时 间 对 比 而 言 ， 指 定 在 时 
间 X 之 前 可 以 阻塞 等 每 ， 而 不 是 说 愿意 阻塞 Y 秒 ) 


>) 。 这 个 超时 时 间 是 用 
timespec 结 构 来 表示 的 ， 它 用 秒 和 纳 秒 来 摘 述 时 间 。 
实例 


图 11-13 给 出 了 如 何 用 pthread_mnutex_timedlock 吉 免 永 久 阻塞 。 


include "apue.h" 
#include <pthread.h> 


int 
main (void) 
{ 
int err; 
struct timespec tout; 
struct tm *tmp; 
char buf[64]; 
pthread mutex t lock = PTHREAD MUTEX INITIALIZER; 


pthread mutex lock(&lock); 
printf("mutex is locked\n") ; 
clock gettime(CLOCK REALTIME, &tout); 
tmp = localtime(&tout.tv sec); 
strftime(buf, sizeof(buf), "$r", tmp); 
printf("current time is %s\n", buf); 
tout.tv sec *- 10; /* 10 seconds from now */ 
/* caution: this could lead to deadlock */ 
err = pthread mutex timedlock(&lock, &tout); 
clock gettime (CLOCK REALTIME, &tout); 
tmp = localtime(&tout.tv sec); 
strftime(buf, sizeof(buf), "$r", tmp); 
printf("the time is now %s\n", buf); 
if (err == 0) 

printf ("mutex locked again! \n"); 
else 

printf("can't lock mvtex again:$sMn",strerror(err)); 
exit(0); 


图 11-13 fii Fjpthread mutex timedlock 


图 11-13 中 的 程序 运行 结果 输出 如 下 : 

$ ./a.out 

mutex is locked 

current time is 11:41:58 AM 

the time is now 11:42:08 AM 

can’t lock mutex again: Connection timed out 

这 个 程序 故意 对 它 已 有 的 互 斥 量 进 行 加 锁 ， 目 的 是 演示 
pthread_mutex_timedlock 是 如 何 工 作 的 。 不 推荐 在 实际 中 使 用 这 种 策 
I, WANES SBOE o 


注意 ， 阻 塞 的 时 间 可 能 会 有 所 不 同 ， 造 成 不 同 的 原因 有 多 种 : 开 
始 时 间 可 能 在 某 秒 的 中 间 位 置 ， 系 统 时 钟 的 精度 可 能 不 足以 精确 到 支 
持 我 们 指定 的 超时 时 间 值 ， 或 者 在 程序 继续 运行 前 ， 调 度 延 迟 可 能 会 
增加 时 间 值 。 

Mac OS X 10.6.8 还 没有 文 持 pthread mnutex timedlock ， 但 是 
FreeBSD 8.0 ` Linux 3.2.0 以 及 Solaris 10 支 持 该 函数 ， 虽 然 Solaris 仍 然 把 
它 放 在 实时 库 librt 中 。Solaris 10 还 提供 了 另 一 个 使 用 相对 超时 时 间 的 画 
ZW o 
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读 写 锁 (reader-writer lock) SEERIA, AMS Bit RE rd 
的 并 行 性 。 互 斥 量 要 么 是 锁 住 状态 ， 要 么 就 是 不 加 锁 状 态 ， 而 且 一 次 
只 有 一 个 线程 可 以 对 其 加 锁 。 读 写 锁 可 以 有 3 种 状态 : 读 模式 下 加 锁 状 
态 ， 写 模式 下 加 锁 状 态 ， 不 加 锁 状态 。 一 次 只 有 一 个 线程 可 以 占有 写 
模式 的 读 写 锁 ， 但 是 多 个 线程 可 以 同时 占有 读 模 式 的 读 写 锁 。 

当 读 写 锁 是 写 加 锁 状 态 时 ， 在 这 个 锁 被 解锁 之 前 ， 所 有 试图 对 这 
个 锁 加 锁 的 线程 都 会 被 阻塞 。 当 读 写 锁 在 读 加 锁 状 态 时 ， 所 有 试图 以 
读 模 式 对 它 进 行 加 锁 的 线程 都 可 以 得 到 访问 权 ， 但 是 任何 希望 以 写 模 
式 对 此 锁 进 行 加 锁 的 线程 都 会 阻塞 ， 直 到 所 有 的 线程 释放 它们 的 读 锁 
为 止 。 虽 然 各 操作 系统 对 读 写 锁 的 实现 各 不 相同 ， 但 当 读 写 锁 处 于 读 
模式 锁 住 的 状态 ， 而 这 时 有 一 个 线程 试图 以 写 模 式 获 取 锁 时 ， 读 写 锁 
通常 会 阻塞 随后 的 读 模式 锁 请 求 。 这 样 可 以 避免 读 模 式 锁 长 期 占用 ， 

等 待 的 写 模 式 锁 请 求 一 直 得 不 到 满足 。 

读 写 锁 非 常 适合 于 对 数据 结构 读 的 次 数 远大 于 写 的 情况 。 当 读 写 
锁 在 写 模式 下 时 ， 它 所 保护 的 数据 结构 就 可 以 被 安全 地 修改 ， 因 为 一 
次 只 有 一 个 线程 可 以 在 写 模式 下 拥有 这 个 锁 。 当 读 写 锁 在 读 模 式 下 


上 时， 只 要 线程 完 获 取 了 读 模式 下 的 读 写 锁 ， 该 锁 所 保护 的 数据 结构 就 
可 以 被 多 个 获得 读 模 式 锁 的 线程 读 取 。 

读 写 锁 也 叫做 共享 互 斥 锁 (shared-exclusivelock) 。 当 读 写 锁 是 读 
模式 锁 住 时 ， 就 可 以 说 成 是 以 共享 模式 锁 住 的 。 当 它 是 写 模 式 锁 住 的 
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的 内 存 之 前 必须 销毁 。 

#include <pthread.h> 


int pthread_rwlock_init(pthread_rwlock_t *restrict rwlock, 

const pthread_rwlockattr_t *restrict attr); 

int pthread_rwlock_destroy(pthread_rwlock_t *rwlock); 

两 个 图 数 的 返回 值 : ERD, eo; 否则 ， 返 回 错误 编号 

读 写 锁 通 过 调用 pthread_rwlock_init 进行 初始 化 。 如 果 和 希望 读 写 锁 
有 默认 的 属性 ， 可 以 传 一 个 nul 指 针 给 attr， 我 们 将 在 12.4.2 世 中 讨论 读 
写 锁 的 属性 。 

Single UNIX Specification 在 XSI 扩 展 中 定义 了 
PTHREAD_RWLOCK_INITIALIZER 常 量 。 如 果 默 认 属 性 就 足够 的 话 ， 
可 以 用 它 对 静态 分 配 的 读 写 锁 进行 初始 化 。 

在 释放 读 写 锁 占 用 的 内 存 之 前 ， 需 要 调用 pthread rwlock destroy 
做 清理 工作 。 如 果 pthread_rwlock init 为 读 写 锁 分 配 了 资源 ， 
pthread rwlock destroy 将 释放 这 些 资 源 。 如 采 在 调用 
pthread rwlock destroy 之 前 就 释放 了 读 写 后 占用 的 内 存 空间 ， 那 么 分 
配给 这 个 锁 的 资源 束 会 丢失 。 

要 在 读 模 式 下 锁定 读 写 锁 ， 需 要 调用 pthread_rwlock_rdlock。 要 在 
写 模 式 下 锁定 读 写 锁 ， 需 要 调用 pthread_rwlock_wrlock。 不 管 以 何 种 方 
式 负 住 读 写 锁 ， 都 可 以 调用 pthread_rwlock_unlockj 井 行 解锁 。 

#include <pthread.h> 


int pthread rwlock rdlock(pthread rwlock t *rwlock); 

int pthread rwlock wrlock(pthread rwlock t *rwlock); 

int pthread rwlock unlock(pthread rwlock t *rwlock); 

MAKAIRE E: ERJ, allo; 否则 ， 返 回 错误 编号 

各 种 实现 可 能 会 对 共享 模式 下 可 获取 的 读 写 锁 的 次 数 进行 限制 ， 
所 以 需要 检查 pthread rwlock rdlock 的 返回 值 。 即 使 
pthread_rwlock_wrlock 和 pthread_rwlock_unlock 有 错误 返回 ， 而 且 从 技 
术 上 来 讲 ， 在 调用 芳 数 时 应 该 总 是 检查 错误 返回 ， 但 是 如 果 锁 设计 合 
理 的 话 ， 就 不 需要 检查 它们 。 错 误 返 回 值 的 定义 只 是 针对 不 正确 使 用 
读 写 锁 的 情况 (如 未 经 初始 化 的 锁 ) ， 或 者 试图 获取 已 拥有 的 锁 从 而 
可 能 产生 和 死 锁 的 情况 。 但 是 需要 注意 ， 有 些 特定 的 实现 可 能 会 定义 另 
外 的 错误 返回 。 

Single UNIX Specification 还 定义 了 读 写 锁 原 语 的 条 件 版 本 。 

#include <pthread.h> 


int pthread_rwlock_tryrdlock(pthread_rwlock_t *rwlock); 
int pthread_rwlock_trywrlock(pthread_rwlock_t *rwlock); 
两 个 图 数 的 返回 值 : ERD, eo; 否则 ， 返 回 错误 编号 

可 以 获取 锁 时 ， 这 两 个 函数 返回 0。 否 则 ， 它 们 返回 错误 EBUSY。 
这 两 个 函数 可 以 用 于 我 们 前 面 讨 论 的 遵守 某 种 锁 层 次 但 还 不 能 完全 如 
免 死 锁 的 情况 。 

实例 

图 11-14 中 的 程序 解释 了 读 写 锁 的 使 用 。 作 业 请 求 队列 由 单个 读 写 
锁 傈 护 。 这 个 例子 给 出 了 图 11-1 所 示 的 一 种 可 能 的 实现 ， 多 个 工作 线程 
获取 单个 主线 程 分 配给 它们 的 作业 。 


#include <stdlib.h> 
#include <pthread.h> 


struct job { 
struct job *j_next; 
struct job *j_prev; 


pthread_t jid; /* tells which thread handles 


/* ... more stuff here ... */ 


struct queue { 
struct job *q head; 
struct job *q tail; 
pthread_rwlock_t q_lock; 


/* 

* Initialize a queue. 

a 

int 

queue_init(struct queue *qp) 
{ 


int err; 


qp->q_head NULL; 

qp->q_tail NULL; 

err = pthread_rwlock_init (&qp->q_lock, NULL); 
if (err != 0) 


return (err); 
/* ... continue initialization ... */ 
return(0); 


/* 
* Insert a job at the head of the queue. 
A 


phis job: *7 


void 
job insert(struct queue *qp, struct job *jp) 
( 

pthread rwlock wrlock(&qp-»q lock); 

jp-»j next = qp-»q head; 

jp-^j prev NULL; 

if (qp-»q head != NULL) 

qp-»q head-»j prev = jp; 
else 


qp->q_ tail = jp; /* list was empty */ 
qp-»q head = jp; 
pthread rwlock unlock(&qp-»q lock); 


/* 
* Append a job on the tail of the queue. 
2d 
void 
job_append (struct queue *qp, struct job *jp) 
{ 
pthread_rwlock_wrlock (&qp->q_lock); 
jp->j_next = NULL; 
jp->j_prev = qp-?q tail; 
if (qp-»q tail != NULL) 
qp-»q tail-»j next = jp; 
else 
qp-»q head = jp; /* list was empty */ 
qp-^q tail = jp; 
pthread rwlock unlock(&qp-»q lock); 


/* 
* Remove the given job from a queue. 
£f 
void 
job remove(struct queue *qp, struct job *jp) 
{ 
pthread rwlock wrlock(&qp-»q lock); 
if (jp == qp-»q head) { 
qp-»q head = jp-»j next; 
if (gqp->q tail == jp) 
qp->q tail = NULL; 
else 
jP-^5j next-»j prev = jp-»5j prev; 
) else if (jp == qp->q tail) { 
qp-»q tail = jp-»5j prev; 
jp-»j prev-»j next = jp->j next; 
) else ( 
jp-?j prev-»j next 


ll 


jp-»5j next; 
jp-»5j next-»j prev = jp-»5j prev; 

} 

pthread_rwlock_unlock (&qp->q_lock) ; 


/* 


* Find a job for the given thread ID. 
ui 
struct job * 
job find(struct queue *qp, pthread t id) 
{ 

struct job *jp; 


if (pthread_rwlock_rdlock(&qp->q_lock) != 0) 
return (NULL); 


for (jp = qp-»q head; jp != NULL; jp = jp-»j next) 
if (pthread equal(jp-»j id, id)) 
break; 


pthread rwlock unlock(&qp-»q lock); 
return (jp); 


图 11-14 使 用 读 写 锁 


在 这 个 例子 中 ， 凡 是 需要 癌 队 列 中 增加 作业 或 者 从 队列 中 删除 作 
业 的 时 候 ， 部 采用 了 写 模 式 来 锁 住 队列 的 读 写 锁 。 不 管 何 时 搜索 队 
列 ， 都 需要 获取 读 模 式 下 的 锁 ， 人 允许 所 有 的 工作 线程 并 发 地 搜索 队 
列 。 在 这 种 情况 下 ， 只 有 在 线程 搜索 作业 的 频率 远 远 高 于 增加 或 删除 
作业 时 ， 使 用 读 写 锁 才 可 能 改善 性 能 。 

工作 线程 只 能 从 队列 中 读 取 与 它们 的 线程 ID 匹配 的 作业 。 由 于 作 
业 结 构 同 一 时 间 只 能 由 一 个 线程 使 用 ， 所 以 不 需要 额外 的 加 锁 。 


11.6.5 超时 的 读 写 锁 


与 互 斥 量 一 样 ，Single UNIX Specification 提 供 了 带 有 超时 的 读 写 锁 
加 锁 函 数 ， 使 应 用 程序 在 获取 读 写 锁 时 避免 陷入 永久 阻塞 状态 。 这 两 
个 函数 是 pthread rwlock timedrdlock 和 pthread_rwlock_timedwrlock ° 

#include <pthread.h> 

#include <time.h> 

int pthread_rwlock_timedrdlock(pthread_rwlock_t *restrict rwlock, 


const struct timespec *restrict tsptr); 


int pthread rwlock timedwrlock(pthread rwlock t *restrict rwlock, 
const struct timespec *restrict tsptr); 
两 个 函数 的 返回 值 : ÆJ, welo; 人 否则， 返回 错误 编号 

这 两 个 事 数 的 行为 与 它们 “不 计时 的 ”版 本 类 似 。tsptr 参 数 指 问 
timespec 结 构 ， 指 定 线程 应 该 停止 阻塞 的 时 间 。 如 果 它 们 不 能 获取 锁 ， 
那么 超时 到 期 时 ， 这 两 个 函数 将 返回 ETIMEDOUT 错 误 。 与 
pthread_mnutex_timedlock 函 数 类 似 ， 超 时 指定 的 是 绝对 时 间 ， 而 不 是 相 
对 时 间 。 


11.6.6 条 件 变量 


条 件 变 量 是 线程 可 用 的 男 一 种 同步 机 制 。 条 件 变量 给 多 个 线程 提 
供 了 一 个 会 合 的 场所 。 条 件 变 量 与 互 不 量 一 起 使 用 时 ， 人 允许 线程 以 无 
竞争 的 方式 等 竺 特定 的 条 件 发 生 。 

条 件 本 和 喘 是 由 互 不 量 保护 的 。 线 程 在 改变 条 件 状态 之 前 必须 首先 
锁 住 互 斥 量 。 其 他 线程 在 获得 互 斥 量 之 前 不 会 察觉 到 这 种 改变 ， 因 为 
互 不 量 必须 在 锁定 以 后 才能 计算 条 件 。 

在 使 用 条 件 变 量 之 前 ， 必 须 先 对 它 进行 初 始 化 。 由 pthread_cond_t 
数据 类 型 表示 的 条 件 变 量 可 以 用 两 种 方式 进行 初始 化 ， 可 以 把 常量 
PTHREAD_COND_INITIALIZER 赋 给 静态 分 配 的 条 件 变 量 ， 但 是 如 果 
条 件 变 量 是 动态 分 配 的 ， 则 需要 使 用 pthread_cond_init 函 数 对 它 进 行 初 

人 化 。 

在 释放 条 件 变 量 的 层 的 内 存 空 间 之 前 ， 可 以 使 用 
pthread_cond_destroy 函 数 对 条 件 变量 进行 反 初 始 化 (deinitialize) ° 

#include <pthread.h> 


int pthread_cond_init(pthread_cond_t *restrict cond, 


const pthread_condattr_t *restrict attr); 


int pthread cond destroy(pthread cond t *cond); 
两 个 图 数 的 返回 值 : ERD, Wx[Blo 否则 ， 返 回 错误 编号 

除非 需要 创建 一 个 具有 非 默认 属性 的 条 件 变 量 ， 否则 
pthread_cond_init 函 数 的 attr 参 数 可 以 设置 为 NULL。 我 们 将 在 12.4.3 世 中 
讨论 条 件 变 量 属性 。 

我 们 使 用 pthread_cond_wait 等 待 条件 变量 变 为 真 。 如 果 在 给 定 的 时 
间 内 条 件 不 能 满足 ， 那 么 会 生成 一 个 返回 错误 码 的 变量 。 

#include <pthread.h> 


int pthread_cond_wait(pthread_cond_t *restrict cond, 
pthread_mutex_t *restrict mutex); 
int pthread_cond_timedwait(pthread_cond_t *restrict cond, 
pthread_mutex_t *restrict mutex, 
const struct timespec *restrict tsptr); 
两 个 函数 的 返回 值 : 者 成 功 ， 返 回 0; 人 否则， 返回 错误 编号 
传递 给 pthread_cond_wait 的 互 不 量 对 条 件 进 行 保 护 。 调 用 者 把 锁 住 
的 互 不 量 传 给 范 数 ， 了 芳 数 然后 目 动 把 调用 线程 放 到 等 每 条 件 的 线程 列 
表 上 ， 对 互 矿 量 解锁 。 这 了 驶 关 闭 了 条 件 检查 和 线程 进入 休眠 状态 等 行 
条 件 改变 这 两 个 操作 之 间 的 时 间 通 道 ， 这 样 线程 就 不 会 错过 条 件 的 任 
何 变 化 。pthread_cond_wait 返 回 时 ， 互 不 量 再 次 被 锁 住 。 
pthread, cond timedwait & 2X 85] BÉ = pthread, cond wait 244 (Lh, 
只 是 多 了 一 个 超时 (tsptr) 。 超 时 值 指定 了 我 们 愿意 等 待 多 长 时 间 ， 它 
是 通过 timespec 结 构 指定 的 。 
如 图 11-13 所 示 ， 需 要 指定 愿意 等 待 多 长 时 间 ， 这 个 时 间 值 是 一 个 
绝对 数 而 不 是 相对 数 。 例 如 ， 假 设 愿意 等 待 3 分 钟 。 那 么 ， 并 不 是 把 3 
分 钟 转换 成 timespec 结 构 ， 而 是 需要 把 当前 时 间 加 上 3 分 钟 再 转换 成 


timespec 结 构 。 


可 以 使 用 dlock_gettime 函 数 (756.1017). 获取 timespec 结 构 表 示 的 
当前 时 间 。 但 是 目前 并 不 是 所 有 的 平台 都 文 持 这 个 函数 ， 因 此 ， 也 可 
以 用 另 一 个 函数 gettimeofday 获取 timeval 结 构 表 示 的 当前 时 间 ， 然 后 把 
这 个 时 间 转 换 成 timespec 结 构 。 要 得 到 超时 值 的 绝对 时 间 ， 可 以 使 用 下 
面 的 函数 (假设 阻塞 的 最 大 时 间 使 用 分 来 表示 的 ) : 

#include <sys/time.h> 
#include <stdlib.h> 


void 


maketimeout(struct timespec *tsp, long minutes) 

{ 

struct timeval now; 

/* get the current time */ 

gettimeofday(&now, NULL); 

tsp-^tv sec = now.tv sec; 

tsp->tv_nsec = now.tv usec * 1000; /* usec to nsec */ 
/* add the offset to get timeout value */ 

tsp-^tv sec *- minutes * 60; 

j 

如 果 超 时 到 期 时 条 件 还 是 没有 出 现 ，pthread_cond_timewait 将 重新 
获取 互 不 量 ， 然 后 返回 错误 ETIMEDOUT。 从 pthread_cond_wait 或 者 
pthread_cond_timedwait 调 用 成 功 返 回 时 ， 线 程 需要 重新 计算 条 件 ， 
为 另 一 个 线程 可 能 已 经 在 运行 并 改变 了 条 件 。 

有 两 个 函数 可 以 用 于 通知 线程 条 件 已 经 满足 。pthread_cond_signal 
函数 至 少 能 唤醒 一 个 等 竺 该 条 件 的 线程 ， 而 pthread_cond_broadcast 函 数 
则 能 唤醒 等 得 该 条 件 的 所 有 线程 。 

POSIX 规范 为 了 简化 pthread cond signal 的 实现 ， 人 允许 它 在 实现 
的 时 候 唤 醒 一 个 以 上 的 线程 。 


#include <pthread.h> 

int pthread_cond_signal(pthread_cond_t *cond); 

int pthread_cond_broadcast(pthread_cond_t *cond); 

PY TEARS: ERD, allo; 否则 ， 返 回 错误 编号 

在 调用 pthread_cond_signal 或 者 pthread_cond_broadcast 时 ， 我 们 说 
这 是 在 给 线程 或 者 条 件 发 信号 。 必 须 注意 ， 一 定 要 在 改变 条 件 状 态 以 
后 再 给 线程 发 信号 。 

实例 

图 11-15 给 出 了 如 何 结合 使 用 条 件 变 量 和 互 不 量 对 线程 进行 同步 。 


#include «pthread.h» 


struct msg { 
struct msg *m next; 
/* ... more stuff here ... */ 


}; 


struct msg *workq; 


pthread cond t qready = PTHREAD COND INITIALIZER; 


pthread mutex t qlock = PTHREAD MUTEX INITIALIZER; 


void 
process msg (void) 
( 


struct msg *mp; 


for (;;) { 
pthread mutex lock(&qlock); 
while (workq == NULL) 
pthread cond wait(&qready, &qlock); 


mp = workq; 

workq - mp-»m next; 

pthread mutex unlock(&qlock); 

/* now process the message mp */ 


pthread mutex lock(&qlock); 
mp-»m next = workq; 

workq - mp; 

pthread mutex unlock(&qlock); 
pthread cond signal(&qready); 


图 11-15 使 用 条 件 变 量 

条 件 是 工作 队列 的 状态 。 我 们 用 互 斥 量 保护 条 件 ， 在 while 循环 中 
判断 条 件 。 把 消息 放 到 工作 队列 时 ， 需 要 占有 互 斥 量 ， 但 在 给 等 待 线 
程 发 信号 时 ， 不 需要 占有 互 斥 量 。 只 要 线程 在 调用 pthread_cond_signal 
之 前 把 消 恩 从 队列 中 拖 出 了 ， 惑 可 以 在 释放 互 不 量 以 后 完成 这 部 分 工 
作 。 因 为 我 们 是 在 while 循环 中 检查 条 件 ， 所 以 不 存在 这 样 的 问题 ， 线 
程 醒 来 ， 发 现 队列 仍 为 裤 ， 然 后 返回 继续 等 待 。 如 果 代 码 不 能 容忍 这 
种 竞争 ， 残 需要 在 给 线程 发 信号 的 时 候 占 有 互 斥 量 。 


11.6.7 9l 


目 旋 尔 与 互 不 量 类 似 ， 但 它 不 是 通过 休眠 使 进程 阻塞 ， 而 是 在 获 
取 锁 之 前 一 直 处 于 忙 等 (EE) 阻塞 状态 。 自 旋 锁 可 用 于 以 下 情况 : 
锁 被 持 有 的 时 间 短 ， 而 且 线 程 并 不 希望 在 重新 调度 上 人 花费 太 多 的 成 
目 旋 锁 通 间作 为 底层 原 语 用 于 实现 其 他 类 型 的 锁 。 根 据 它 们 所 基 
于 的 系统 体系 结构 ， 可 以 通过 使 用 测试 并 设置 指令 有 效 地 实现 。 当 然 
这 里 说 的 有 效 也 还 是 会 导致 CPU 资 源 的 浪费 ， 当 线程 自 旋 等 待 锁 变 为 


可 用 时 ，CPU 不 能 做 其 他 的 事情 。 这 也 是 目 旋 锁 只 能 够 被 持 有 一 人 小段 
时 间 的 原因 。 

当 目 旋 锁 用 在 非 抢占 式 内 核 中 时 是 非常 有 用 的 : 除了 提供 互 不 机 
制 以 外 ， 它 们 会 阻塞 中 断 ， 这 样 中 断 处 理 程序 就 不 会 让 系统 陷入 死 锁 
状态 ， 因 为 它 需 要 获取 已 被 加 锁 的 自 旋 锁 (把 中 断想 成 是 男 一 种 抢 
E) 。 在 这 种 类 型 的 内 核 中 ， 中 断 处 理 程序 不 能 休眠 ， 因 此 它们 能 用 
的 同步 原 语 只 能 是 目 旋 锁 。 

但 是 ， 在 用 户 层 ， 目 旋 锁 并 不 是 非常 有 用 ， 除 非 运行 在 不 允许 抢 
占 的 实时 调度 类 中 。 运 行 在 分 时 调度 类 中 的 用 户 层 线 程 在 两 种 情况 下 
可 以 被 取消 调度 : 当 它 们 的 时 间 片 到 期 时 ， 或 者 具有 更 高 调度 优先 级 
HJZEEENLAR AE BE HIS TTI o EEE P, WRIA Ae, € 
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的 时 间 更 长 。 

很 多 互 斥 量 的 实现 非常 高 效 ， 以 至 于 应 用 程序 采用 互 斥 锁 的 性 能 
与 曾经 采用 过 目 旋 锁 的 性 能 基本 是 相同 的 。 事 实 上 ， 有 些 互 不 量 的 实 
现在 试图 获取 互 不 量 的 时 候 会 目 旋 一 小 段 时 间 ， 只 有 在 目 旋 计数 到 达 
某 一 国人 的 时 候 才 会 休眠 。 这 些 因素 ， 加 上 现代 处 理事 的 进步 ， 使 得 
上 下 文 切换 越 来 越 快 ， 也 使 得 目 旋 锁 只 在 某 些 特定 的 情况 下 有 用 。 

目 旋 锁 的 接口 与 互 不 量 的 接口 类 似 ， 这 使 得 它 可 以 比较 容易 地 从 
一 个 替换 为 另 一 个 。 可 以 用 pthread_spin_init 函数 对 目 旋 锁 进行 初始 
化 。 用 pthread spin destroy 函数 进行 目 旋 锁 的 反 初 始 化 。 

#include <pthread.h> 


int pthread_spin_init(pthread_spinlock_t *lock, int pshared); 
int pthread_spin_destroy(pthread_spinlock_t *lock); 
两 个 图 数 的 返回 值 : ERD, eo; 否则 ， 返 回 错误 编号 
只 有 一 个 属性 是 目 旋 锁 特 有 的 ， 这 个 属性 只 在 文 持 线 程 进程 共享 
同步 (Thread Process-Shared Synchronization) 选项 (这 个 选项 目前 在 


Single UNIX Specification 中 是 强制 的 ， 见 图 2-5) 的 平台 上 才 用 得 到 。 
pshared 参数 表示 进程 共享 属性 ， 表 明 目 旋 锁 是 如 何 获取 的 。 如 果 它 设 
为 PTHREAD_PROCESS_SHARED， 则 自 旋 锁 能 被 可 以 访问 锁 底 层 内 
存 的 线程 所 获取 ， 即 便 那 些 线程 属于 不 同 的 进程 ， 情 况 也 是 如 此 。 人 否 
则 pshared 参 数 设 为 PTHREAD PROCESS PRIVATE, ， 自 旋 锁 就 只 能 被 
初始 化 该 锁 的 进程 内 部 的 线程 所 访问 。 

可 以 用 pthread_spin_lock 或 pthread_spin_trylock 对 自 旋 锁 进行 加 锁 ， 
前 者 在 获取 锁 之 前 一 直 自 旋 ， 后 者 如 有 果 不 能 获取 锁 ， 就 立即 返回 
EBUSY 错误 。 注 意 ，pthread_spin_trylock 不 能 自 旋 。 不 管 以 何 种 方式 
加 锁 ， 目 施 锁 都 可 以 调用 pthread_spin_unlock 碎 数 解 锁 。 

#include <pthread.h> 


int pthread spin lock(pthread spinlock t *lock); 

int pthread spin trylock(pthread spinlock t *lock); 

int pthread spin unlock(pthread spinlock t *lock); 

MAKAIRE: ERJ, xeo; 否则 ， 返 回 错误 编号 

注意 ， 如 果 目 旋 锁 当前 在 解锁 状态 的 话 ，pthread_spin_lock 函 数 不 
要 目 旋 束 可 以 对 它 加 锁 。 如 有 果 线 程 已 经 对 它 加 锁 了 ， 结 果 丈 是 未 定义 
的 。 调 用 pthread_spin_lock 会 返回 EDEADLK 错 误 (或 其 他 错误 ) ， 或 
者 调用 可 能 会 永久 目 旋 。 具 体 行为 依赖 于 实际 的 实现 。 试 图 对 没有 加 
锁 的 目 旋 锁 进行 解锁 ， 结 果 也 是 未 定义 的 。 

不 管 是 pthread_spin_lock 还 是 pthread_spin_trylock， 返 回 值 为 0 的 话 
就 表示 自 旋 锁 被 加 锁 。 需 要 注意 ， 不 要 调用 在 持 有 目 旋 锁 情 况 下 可 能 
会 进入 休眠 状态 的 函数 。 如 果 调 用 了 这 些 范 数 ， 会 浪费 CPU 资 源 ， 
为 其 他 线程 需要 获取 目 旋 锁 需要 等 待 的 时 间 就 延长 了 。 


11.6.8 屏障 


屏障 (barrier) 是 用 户 协调 多 个 线程 并 行 工 作 的 同步 机 制 。 屏 障 允 
许 每 个 线程 等 待 ， 直 到 所 有 的 合作 线程 都 到 达 某 一 点 ， 然 后 从 该 点 继 
续 执 行 。 我 们 已 经 看 到 一 种 屏障 ，pthread_join 芳 数 就 是 一 种 屏障 ， 人 允 
许 一 个 线程 等 待 ， 直 到 另 一 个 线程 退出 。 
但 是 屏障 对 象 的 概念 更 广 ， 它 们 允许 任意 数量 的 线程 等 待 ， 直 到 
所 有 的 线程 完成 处 理工 作 ， 而 线程 不 需要 退出 。 所 有 线程 达到 屏障 后 
可 以 接着 工作 。 
可 以 使 用 pthread_barrier_init 函数 对 屏障 进行 初始 化 ， 用 
thread barrier destroy KAU) I 44, ° 
#include <pthread.h> 
int pthread_barrier_init(pthread_barrier_t *restrict barrier, 
const pthread_barrierattr_t *restrict attr, 
unsigned int count); 
int pthread barrier destroy(pthread barrier t *barrier); 
两 个 图 数 的 返回 值 : ERD, eo; 否则 ， 返 回 错误 编号 
初始 化 屏障 时 ， 可 以 使 用 count 参 数 指定 ， 在 允许 所 有 线程 继续 运 
行 之 前 ， 必 须 到 达 屏 障 的 线程 数目 。 使 用 attr 参 数 指定 屏障 对 象 的 属 
性 ， 我 们 会 在 下 一 章 详细 讨论 。 现 在 设置 attr 为 NULL， 用 默认 属性 初 
台 化 屏障 。 如 果 使 用 pthread_barrier_init 函 数 为 屏障 分 配 资源 ， 那 么 在 
反 初 始 化 屏障 时 可 以 调用 pthread_barrier_destroy 函 数 释放 相应 的 资源 。 
可 以 使 用 pthread_barrier wait 函数 来 表明 ， 线 程 已 完成 工作 ， 谁 备 
等 所 有 其 他 线程 赴 上 来 。 
#include <pthread.h> 
int pthread_barrier_wait(pthread_barrier_t *barrier); 
REME: EH, ROR 
PTHREAD BARRIER SERIAL THREAD; 否则 ， 返 回 错误 编号 


调 用 pthread barrier wait 的 线程 在 屏障 计数 (调用 
pthread_barrier_init 时 设 定 ) 未 满足 条 件 时 ， 会 进入 休眠 状态 。 如 果 该 
线程 是 最 后 一 个 调用 pthread_barrier_wait 的 线程 ， 就 满足 了 屏障 计数 ， 
所 有 的 线程 都 被 唤醒 。 

对 于 一 个 任意 线程 pthread_barrier_wait K ZX i Fl T 
PTHREAD_BARRIER_SERIAL_THREAD“。 剩 下 的 线程 看 到 的 返回 值 
是 0。 这 使 得 一 个 线程 可 以 作为 主线 程 ， 它 可 以 工作 在 其 他 所 有 线程 已 
完成 的 工作 结果 上 。 

一 旦 达到 屏障 计数 值 ， 而 且 线 程 处 于 非 阻塞 状 态 ， 屏 障 束 可 以 被 

用 。 但 是 除非 在 调用 了 pthread_barrier_destroy 范 数 之 后 ， 叉 调用 了 
pthread_barrier_init 范 数 对 计数 用 另外 的 数 进 行 初始 化 ， 否 则 屏障 计数 
会 改变 。 

实例 

图 11-16 给 出 了 在 一 个 任务 上 合作 的 多 个 线程 之 间 如 何 用 屏障 进行 
同步 。 


#include "apue.h" 
#include <pthread.h> 
#include <limits.h> 
#include <sys/time.h> 


#define NTHR 8 /* number of threads */ 
#define NUMNUM 8000000L /* number of numbers to sort */ 
#define TNUM (NUMNUM/NTHR) /* number to sort per thread */ 


long nums [NUMNUM]; 
long snums [NUMNUM]; 


pthread barrier t b; 


#ifdef SOLARIS 
fdefine heapsort qsort 
felse 
extern int heapsort(void *, size t, size t, 
int (*)(const void *, const void *)); 
fendif 


/* 
* Compare two long integers (helper function for heapsort) 


gi 


int 


complong (const void *argl, const void *arg2) 


{ 
long 11 = *(long *)argl; 
long 12 = *(long *)arg2; 


if (11 == 12) 
return 0; 
else if (11 « 12) 
return 1s 

else 
return 1; 


/* 


* Worker thread to sort a portion of the set of numbers. 


a 
void * 
thr fn(void *arg) 
{ 
long idx = (long) arg; 


heapsort(&nums[idx], TNUM, sizeof(long), 


pthread barrier wait (&b) ; 


/* 

* Go off and perform more work ... 
sF 

return ( (void *)0); 


/* 
* Merge the results of the individual sorted 
*y 
void 
merge () 
{ 
long idx [NTHR]; 
long i, minidx, sidx, num; 


for (i = 0; i < NTHR; i++) 
idx[i] = i * TNUM; 

for (sidx = 0; sidx < NUMNUM; sidx++) 
num = LONG MAX; 
for (i = 0; i < NTHR; i++) { 


if ((idx[i] < (i+1)*TNUM) && (nums[idx[i]] 


num = nums[idx[i]]; 
minidx = i; 


} 
snums[sidx] = nums[idx[minidx] ]; 
idx [minidx]++; 


{ 


complong) ; 


< num) ) 


{ 


int 


main() 
( 
unsigned long ay 
struct timeval start, end; 
long long startusec, endusec; 
double elapsed; 
int err; 
pthread t clas 
/* 
* Create the initial set of numbers to sort. 
*/ 


srandom(1); 
for (i = 0; i < NUMNUM; i++) 


nums[i] = random(); 
/* 
* Create 8 threads to sort the numbers. 
光大 


gettimeofday(&start, NULL); 
pthread barrier init(&b, NULL, NTHR-*1); 
for (i = 0; i < NTHR; i++) { 
err = pthread_create(&tid, NULL, thr_fn, (void *) (i * TNUM)); 
if (err != 0) 
err exit(err, "can't create thread"); 
} 
pthread barrier wait (&b); 
merge (); 
gettimeofday(&end, NULL); 


/* 
* Print the sorted list. 

*J 

startusec = start.tv sec * 1000000 + start.tv usec; 


endusec = end.tv sec * 1000000 + end.tv usec; 
elapsed = (double) (endusec - startusec) / 1000000.0; 
printf("sort took $.4f seconds\n", elapsed); 
for (i = 0; i < NUMNUM; i++) 

printf("$1dWMn", snums[i]); 
exit(0); 


图 11-16 使 用 屏障 

这 个 例子 给 出 了 多 个 线程 只 执行 一 个 任务 时 ， 使 用 屏障 的 简单 情 
况 。 在 更 加 实际 的 情况 下 ， 工 作 线 程 在 调用 pthread_barrier_wait 函 数 返 
回 后 会 接着 执行 其 他 的 活动 。 


在 这 个 实例 中 ， 使 用 8 个 线程 分 解 了 800 万 个 数 的 排序 工作 。 每 个 
线程 用 扒 排 序 算法 对 100 万 个 数 进 行 排序 (详细 算法 请 参阅 
Knuth[1998]) 。 然 后 主线 程 调 用 一 个 函数 对 这 些 结 采 进行 合并 。 

并 不 需要 使 用 pthread barrier wait 函数 中 的 返回 值 
PTHREAD BARRIER SERIAL THREAD 来 决定 哪个 线程 执行 结果 合 
并 操作 ， 因 为 我 们 使 用 了 主线 程 来 完成 这 个 任务 。 这 也 是 把 屏障 计数 
值 设 为 工作 线程 数 加 1 的 原因 ， 主 线程 也 作为 其 中 的 一 个 候选 线程 。 

如 果 只 用 一 个 线程 去 完成 800 万 个 数 的 堆 排 友 ， 那 么 与 图 11-16 中 的 
程序 相 比 ， 我 们 将 能 看 到 图 11-16 中 的 程序 在 性 能 上 有 显著 提升 。 在 8 核 
处 理 器 系统 上 ， 单 线程 程序 对 800 万 个 数 进 行 排序 需要 12.14 秒 。 同 样 的 
系统 ， 使 用 8 个 并 行 线程 和 1 个 合并 结果 的 线程 ， 相 同 的 800 万 个 数 的 排 
序 仅 需要 1.91 秒 ， 速 度 提 升 了 6 倍 。 


11.7 小 结 


本 章 介 绍 了 线程 的 概念 ， 讨 论 了 现 有 的 创建 和 销毁 线程 的 POSIX.1 
原 语 ; 此 外 ， 还 介绍 了 线程 同步 问题 ， 讨 论 了 5 个 基本 的 同步 机 制 
( 互 不 量 、 读 写 锁 、 条 件 变量 、 自 旋 锁 以 及 屏障 ) ， 了 解 了 如 何 使 用 
它们 来 保护 共享 资源 。 


习题 


11.1 修改 图 11-4 所 示 的 实例 代码 ， 正 确 地 在 两 个 线程 之 间 传 递 结 
构 。 


11.2 在 图 11-14 所 示 的 实例 代码 中 ， 需 要 另外 添加 什么 同步 CE 
需要 的 话 ) 可 以 使 得 主线 程 改 变 与 挂 起 作业 关联 的 线程 ID? 这 会 对 
job_remove 函 数 产 生 什 么 影响 ? 

11.3 把 图 11-15 中 的 技术 运用 到 工作 线程 实例 (图 11-1 和 图 11-14) 
中 实现 工作 线程 本 数 。 不 要 环 记 更 新 queue_init KROES Bvt Tw) 
台 化 ， 修 改 job insert 和 job_append 范 数 给 工作 线程 发 信号 。 会 出 现 什 
么 样 的 困难 ? 

11.4 下 面 哪个 步骤 序列 是 正确 的 ? 

(1) 对 互 斥 量 加 锁 (pthread mutex lock) ° 

(2) 改变 互 斥 量 保护 的 条 件 。 

(3) 给 等 待 条 件 的 线程 发 信号 (pthread cond broadcast) ° 
(4) 对 互 斥 量 解锁 (pthread_mutex_unlock) ° 


(1) 对 互 斥 量 加 锁 (pthread mutex lock) ° 
(2) 改变 互 斥 量 保护 的 条 件 。 
(3) 对 互 斥 量 解锁 (pthread mutex unlock) 。 
(4) 给 等 待 条 件 的 线程 发 信号 (pthread cond broadcast) ° 
11.5 实现 屏障 需要 什么 同步 原 语 ? 给 出 pthread_barrier_wait 函 数 的 
一 个 实现 。 


123€ 线程 


12.1 引言 


第 11 章 讲 了 线程 以 及 线程 同步 的 基础 知识 。 本 章 将 讲解 控制 线程 
行为 方面 的 详细 内 容 ， 介 绍 线程 属性 和 同步 原 语 属性 。 前 面 的 章 市 中 
使 用 的 都 它们 的 默认 行为 ， 没 有 进行 详细 介绍 。 

接 下 来 还 将 介绍 同一 进程 中 的 多 个 线程 之 间 如 何 保持 数据 的 私有 
性 。 最 后 讨论 基于 进程 的 系统 调用 如 何 与 线程 进行 交互 。 


12.2 线程 


42.5.40 FiFi f sysconfER ZI ° Single UNIX Specification 定 义 了 
与 线程 操作 有 天 的 一 些 限制 ， 图 2-11 并 没有 列 出 这 些 限 制 。 与 其 他 的 系 
统 限制 一 样 ， 这 些 限 制 也 可 以 通过 sysconf 函 数 进行 查询 。 图 12-1 忌 结 
了 这 些 限 制 。 


PTHREAD DESTRUCTOR _ 线程 退出 时 操作 系统 实现 试图 销毁 线程 特 | SC THREAD DESTRUCTOR_ 
ITERATIONS 定数 据 的 最 大 次 数 〈 见 12.6 节 ) ITERATIONS 


PTHREAD KEYS MAX 进程 可 以 创建 的 键 的 最 大 数目 〈 见 12.6 节 ) SC THREAD KEYS MAX 
PTHREAD STACK MIN -个 线程 的 栈 可 用 的 最 小 字 节 数 ( 见 12.3 节 ) | SC THREAD STACK MIN 
PTHREAD THREADS MAX 进程 可 以 创建 的 最 大 线程 数 CU 12.3 节 ) SC THREAD THREADS MAX 


图 12-1 线程 限制 和 sysconf 的 name 参 数 


与 sysconf 报告 的 其 他 限制 一 样 ， 这 些 限制 的 使 用 是 为 了 增强 应 用 
程序 在 不 同 的 操作 系统 实现 之 间 的 可 移植 性 。 例 如 ， 如 有 果 应 用 程序 需 
要 为 它 管理 的 每 个 文件 创建 4 个 线程 ， 但 是 系统 却 并 不 允许 创建 所 有 这 
些 线程 ， 这 时 可 能 束 必 须 限制 当前 可 并 发 管理 的 文件 数 。 

图 12-2 给 出 了 本 书 摘 述 的 4 种 操作 系统 实现 中 线程 限制 的 值 。 如 采 
操作 系统 实现 的 限制 是 不 确定 的 ， 列 出 的 值 束 是 “没有 确定 的 限制 ” 


(no limit) 。 但 这 并 不 意味 着 值 是 无 限制 的 。 


限制 名 称 FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 Solaris 10 
4 


PTHREAD DESTRUCTOR ITERATIONS 4 4 | 没有 确定 的 限制 
PTHREAD KEYS MAX 256 1 024 512 | 没有 确定 的 限制 
PTHREAD STACK MIN 2 048 16 384 8 192 8192 
PTHREAD THREADS MAX 没有 确定 的 限制 | 没有 确定 的 限制 | 没有 确定 的 限制 | 没有 确定 的 限制 


图 12-2 线程 配置 限制 的 实例 

注意 ， 虽 然 某 个 操作 系统 实现 可 能 没有 提供 访问 这 些 限 制 的 方 
法 ， 但 这 并 不 意味 着 这 些 限制 不 存在 ， 这 只 是 意味 着 操作 系统 实现 没 
有 为 使 用 sysconf 访 问 这 些 值 提供 可 用 的 方法 。 


12.3 线程 属 ' 


pthread 接口 允许 我 们 通过 设置 每 个 对 象 关联 的 不 同属 性 来 细 调 线 
程 和 同步 对 象 的 行为 。 通 常 ， 管 理 这 些 属 性 的 函数 都 遵循 相同 的 模 
s 


(1) 每 个 对 象 与 它 自 己 类 型 的 属性 对 象 进行 关联 (线程 与 线程 属 
性 关联 ， 互 不 量 与 互 不 量 属性 关联 ， 等 等 。 一 个 属性 对 象 可 以 代表 
多 个 属性 。 属 性 对 象 对 应 用 程序 来 说 是 不 透明 的 。 这 意味 着 应 用 程序 


并 不 需要 了 解 有 关 属 性 对 象 内 部 结构 的 详细 细 季 ， 这 样 可 以 增强 应 用 
程序 的 可 移植 性 。 取 而 代 之 的 是 ， 需 要 提供 相应 的 函数 来 管理 这 些 属 
性 对 象 。 

(2) 有 一 个 初始 化 函数 ， 把 属性 设置 为 默认 值 。 

(3) 还 有 一 个 销毁 属性 对 象 的 范 数 。 如 果 初 始 化 函数 分 配 了 与 属 
性 对 象 关联 的 资源 ， 销 毁 函 数 负 责 释 放 这 些 资源 。 

(4) 每 个 属性 都 有 一 个 从 属性 对 象 中 获取 属性 值 的 画 数 。 由 于 函 
数 成 功 时 会 返回 0， 失 败 时 会 返回 错误 编号 ， 所 以 可 以 通过 把 属性 值 存 
情 在 函数 的 某 一 个 参数 指定 的 内 存单 元 中 ， 把 属性 值 返 回 给 调用 者 。 

(5) 每 个 属性 都 有 一 个 设置 属性 值 的 函数 。 在 这 种 情况 下 ， 属 性 
值 作为 参数 按 值 传递 。 

在 第 11 划 所 有 调用 pthread_create 芳 数 的 实例 中 ， 传 入 的 参数 都 是 空 
指针 ， 而 不 是 指 回 pthread_attr_ t 结 构 的 指针 。 可 以 使 用 pthread_attr_{t 结 
构 修 改线 程 默认 属性 ， 并 把 这 些 属 性 与 创建 的 线程 联系 起 来 。 可 以 使 
用 pthread attr init 函数 初始 化 pthreadatrt 结 构 。 在 调用 
pthread_attr_init 以 后 ，pthread_attr_t 结 构 所 包含 的 驶 是 操作 系统 实现 文 
持 的 所 有 线程 属性 的 默认 值 。 

#include <pthread.h> 


int pthread_attr_init(pthread_attr_t *attr); 
int pthread_attr_destroy(pthread_attr_t *attr); 
两 个 图 数 的 返回 值 : ERD, eo; 否则 ， 返 回 错误 编号 

如 有 果 要 反 初 始 化 pthread_attr_t 结 构 ， 可 以 调用 pthread_attr_destroy 函 
数 。 如 果 pthread_attr_init 的 实现 对 属性 对 象 的 内 存 空间 是 动态 分 配 的 ， 
pthread, attr destroy 束 会 释放 该 内 存 空 间 。 除 此 之 外 ， 
pthread_attr_destroy 还 会 用 无 效 的 值 初始 化 属性 对 象 ， 因 此 ， 如 果 该 属 
性 对 象 被 误 用 ， 将 会 导致 pthread_create 函 数 返 回 错 误 码 。 


图 12-3 总 结 了 POSIX.1 定义 的 线程 属性 。POSIX.1 还 为 线程 执行 
调度 (Thread Execution Scheduling) 选项 定义 了 额外 的 属性 ， 用 以 支持 
实时 应 用 ， 但 我 们 并 不 打算 在 这 里 讨论 这 些 属性 。 图 12-3 同 时 给 出 了 各 
个 操作 系统 平台 对 每 个 线程 属性 的 支持 情况 。 
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detachstate 线程 的 分 离 状态 属性 


guardsize 线程 栈 末 尾 的 警戒 缓冲 区 大 小 〈 字 节 数 ) 
stackaddr | 线程 栈 的 最 低地 址 


stacksize 


图 12-3 POSIX.1 线 程 属性 

11.5 节 介绍 了 分 离线 程 的 概念 。 如 果 对 现 有 的 某 个 线程 的 终止 状态 
不 感 兴趣 的 话 ， 可 以 使 用 pthread_detach 函 数 让 操作 系统 在 线程 退出 时 
收回 它 所 占用 的 资源 。 

如 有 果 在 创建 线程 时 就 知道 不 需要 了 解 线程 的 终止 状态 ， 就 可 以 修 
PX pthread attr t 结构 中 的 detachstate 线 程 属性 ， 让 线程 一 开始 就 处 于 分 
离 状 态 。 可 以 使 用 pthread_attr_setdetachstate 函 数 把 线程 属性 detachstate 
设置 成 以 下 两 个 合法 值 之 一 : PTHREAD_CREATE_DETACHED， 以 分 
离 状 态 启动 线程 ,或 者 PTHREAD_CREATE_JOINABLE， 正 常 启动 线 
程 ， 应 用 程序 可 以 获取 线程 的 终止 状态 。 

#include <pthread.h> 


int pthread attr getdetachstate(const pthread attr t *restrict attr, 
int *detachstate); 
int pthread attr setdetachstate(pthread attr t *attr, int *detachstate); 
两 个 图 数 的 返回 值 : ERD, eo; 否则 ， 返 回 错误 编号 
可 以 调用 pthread_attr_getdetachstate 芳 数 获取 当前 的 detachstate 线 程 
E UE cB S XH Bum mE mU LA dx HOM 
PTHREAD CREATE DETACHED  , 要 A X 置 成 


PTHREAD CREATE _JOINABLE， 具 体 要 取决 于 给 定 pthread_attr_t 结 构 
中 的 属性 值 。 

实例 

图 12-4 给 出 了 一 个 以 分 离 状态 创建 线程 的 函数 。 


#include "apue.h" 
#include <pthread.h> 


int 


makethread(void *(*fn) (void *), void *arg) 
{ 

int err; 

pthread t tid; 

pthread attr t attr; 


err = pthread attr init(&attr); 
if (err != 0) 
return(err); 
err - pthread attr setdetachstate(&attr, PTHREAD CREATE DETACHED); 
AE "Wess m0) 
err = pthread create(&tid, &attr, fn, arg); 
pthread attr destroy(&attr); 


return(err); 


图 12-4 以 分 离 状 态 创建 线程 


iE, JEA T pthread attr. destroy H ži ya FH jo EME ° EXT 
实例 中 ， 我 们 对 线程 属性 进行 了 合理 的 初始 化 ， 因 此 
pthread attr destroy 应 该 不 会 失败 。 但 是 ， 如 有 果 pthread_attr_destroy 确 实 
出 现 了 失败 的 情况 ， 将 难以 清理 : 必须 销毁 刚刚 创建 的 线程 ， 也 许 这 
个 线程 可 能 已 经 运行 ， 并 且 与 pthread_attr_destroy 函数 可 能 是 异步 执行 
HJ » ZZ &pthread attr destroy 的 错误 返回 可 能 出 现 的 最 坏 情况 是 ， 如 采 
pthread attr init 已 经 分 配 了 内 存 空 间 ， 就 会 有 少量 的 内 存 泄 漏 。 男 一 
方面 ， 如 果 pthread attr init 成 功 地 对 线程 属性 进行 了 初始 化 ， 但 之 后 
pthread_attr_destroy 的 清理 工作 失败 ， 那 么 将 没有 任何 种 救 策 上 略 ， 因 为 
线程 属性 结构 对 应 用 程序 来 说 是 不 透明 的 ， 可 以 对 线程 属性 结构 进行 
清理 的 唯一 接口 是 pthread_attr_destroy， 但 它 失 败 了 ° 


对 于 遵循 POSIX 标 准 的 操作 系统 来 说 ， 并 不 一 定 要 文 持 线程 栈 属 
性 ， 但 是 对 于 遵循 Single UNIX Specification 中 XSI 选项 的 系统 来 说 ， 
文 持 线程 栈 属 性 就 是 必需 的 。 可 以 在 编译 阶段 使 用 
POSIX THREAD ATTR STACKADDR All 
_POSIX_THREAD_ATTR_STACKSIZE 符 号 来 检查 系统 是 否 支 持 每 一 个 
线程 栈 属性 。 如 果 系 统 定义 了 这 些 符 号 中 的 一 个 ， 就 说 明 它 支持 相应 
的 线程 栈 属 性 。 或 者 ， 也 可 以 在 运行 阶段 把 _SC_THREAD_ATTR_ 
STACKADDR 和 _SC_THREAD_ATTR_STACKSIZE 参数 传 给 sysconf 画 
数 ， 检 查 运 行 时 系统 对 线程 栈 属性 的 支持 情况 。 

可 以 使 用 函数 pthread_attr_getstack 和 pthread_attr_setstack 对 线程 栈 
属性 进行 管理 。 

#include <pthread.h> 


int pthread_attr_getstack(const pthread_attr_t *restrict attr, 
void **restrict stackaddr, 
size_t *restrict stacksize); 
int pthread_attr_setstack(pthread_attr_t *attr, 
void *stackaddr, size_t stacksize); 
两 个 图 数 的 返回 值 : ERD, xeo; 否则 ， 返 回 错误 编号 
对 于 进程 来 说 ， 虚 地 址 空间 的 大 小 是 固定 的 。 因 为 进程 中 只 有 一 
个 栈 ， 所 以 它 的 大 小 通常 不 是 问题 。 但 对 于 线程 来 说 ， 同 样 大 小 的 虚 
地 址 空间 必须 被 所 有 的 线程 栈 共享 。 如 果 应 用 程序 使 用 了 许多 线程 ， 
以 致 这 些 线程 栈 的 累计 大 小 超过 了 可 用 的 虚 地 址 空间 ， 就 需要 减少 黯 
认 的 线程 栈 大 小 。 男 一 方面 ， 如 果 线 程 调用 的 函数 分 配 了 大 量 的 自动 
变量 ， 或 者 调用 的 函数 涉及 许多 很 深 的 栈 帧 (stack frame) ， 那 么 需要 
的 栈 大 小 可 能 要 比 默认 的 大 。 
如 果 线 程 栈 的 虚 地 址 空间 都 用 完了 ， 那 可 以 使 用 malloc 或 者 mmap 
( 见 14.8 节 ) 来 为 可 替代 的 栈 分 配 空间 ， 并 用 pthread_attr_setstack 范 数 


来 改变 新 建 线程 的 栈 位 置 。 由 stackaddr 参 数 指定 的 地 址 可 以 用 作 线 程 栈 
的 内 存 范围 中 的 最 低 可 寻 址 地 址 ， 该 地 址 与 处 理 器 结构 相应 的 边界 应 
对 齐 。 当 然 ， 这 要 假设 malloc 和 mmap 所 用 的 虚 地 址 范围 与 线程 栈 当 前 
使 用 的 虚 地 址 范围 不 同 。 

stackaddr 线 程 属性 被 定义 为 栈 的 最 低 内 存 地 址 ， 但 这 并 不 一 定 是 栈 
的 开始 位 置 。 对 于 一 个 给 定 的 处 理 器 结构 来 说 ， 如 果 栈 是 从 高 地 址 向 
低地 址 方向 增长 的 ， 那 么 stackaddr 线 程 属性 将 是 栈 的 结尾 位 置 ， 而 不 是 
开始 位 置 。 

应 用 程序 也 可 以 通 过 pthread attr getstacksize 和 
pthread_attr_setstacksize 函 数 读 取 或 设置 线程 属性 stacksize。 

#include <pthread.h> 


int pthread_attr_getstacksize(const pthread_attr_t *restrict attr, 
size_t *restrict stacksize); 
int pthread_attr_setstacksize (pthread_attr_t *attr, size_t stacksize); 
两 个 图 数 的 返回 值 : ERD, eo; 否则 ， 返 回 错误 编号 

如 果 和 希望 改变 默认 的 栈 大 小 ， 但 又 不 想 自己 处 理 线 程 栈 的 分 配 问 
题 ， 这 时 使 用 pthread_attr_setstacksize 函 数 就 非常 有 用 。 设 置 stacksize 属 
性 时 ， 选 择 的 stacksize 不 能 小 于 PTHREAD_STACK_MIN。 

线程 属性 guardsize 控 制 着 线程 栈 末 尾 之 后 用 以 避免 栈 洲 出 的 扩展 内 
存 的 大 小 。 这 个 属性 默认 值 是 由 具体 实现 来 定义 的 ， 但 常用 值 是 系统 
页 大 小 。 可 以 把 guardsize 线 程 属性 设置 为 0， 不 允许 属性 的 这 种 特征 行 
KEE: 在 这 种 情况 下 ， 不 会 提供 警戒 缓冲 区 。 同 样 ， 如 果 修 改 了 线 
程 属 性 stackaddr， 系 统 束 认为 我 们 将 目 己 管理 栈 ， 进 而 使 栈 警 戒 缓 冲 区 
机 制 无 效 ， 这 等 同 于 把 guardsize 线 程 属性 设置 为 0。 

#include <pthread.h> 

iint pthread_attr_getguardsize(const pthread_attr_t *restrict attr, 


size_t *restrict guardsize); 


int pthread attr setguardsize(pthread attr t *attr, size t guardsize); 
两 个 图 数 的 返回 值 : ERD, xx[Blo; 否则 ， 返 回 错误 编号 

如 果 guardsize 线 程 属性 被 修改 了 ， 操 作 系 统 可 能 会 把 它 取 为 页 大 小 
的 整数 倍 。 如 果 线 程 的 栈 指针 洲 出 到 警戒 区 域 ， 应 用 程序 就 可 能 通过 
言 号 接收 到 出 错 信息 。 

Single UNIX Specification 还 定义 了 一 些 其 他 的 可 选 线程 属性 供 实时 
应 用 程序 使 用 ， 但 在 这 里 不 讨论 这 些 属 性 。 

线程 还 有 一 些 其 他 的 pthread_attr_t 结 构 中 没有 表示 的 属性 ， 可 撤销 
状态 和 可 撤销 类 型 。 我 们 将 在 12.7 市 中 讨论 它们 。 


束 像 线程 具有 属性 一 样 ， 线 程 的 同步 对 象 也 有 属性 。11.6.7 节 中介 
绍 了 目 旋 锁 ， 它 有 一 个 属性 称 为 进程 共享 属性 。 本 节 讨 论 互 斥 量 属 
性 、 谈 写 锁 属性 、 条 件 变量 属性 和 屏障 属性 。 


12.4.1 E Jr E RS PE 


互 斥 量 属 性 是 用 pthread_mnutexattr_t 结 构 表 示 的 。 第 11 章 中 每 次 对 
H Jr & # fT w) eK, b o Hw de 用 
PTHREAD MUTEX INITIALIZER % & 20-4 H TR [8] E. Je EJE PEZ P RP] 
空 指 针 作 为 参数 调用 pthread_mutex_init 函 数 ， 得 到 互 斥 量 的 默认 属性 。 
对 于 非 默认 属性 ， 可 以 用 pthread mutexattr init 初始 化 
pthread_mnutexattr_t 结 构 ， 用 pthread_mnutexattr_destroy 来 反 初 始 化 。 
#include <pthread.h> 


int pthread_mutexattr_init(pthread_mutexattr_t *attr); 


int pthread mutexattr destroy(pthread mutexattr t *attr); 

两 个 图 数 的 返回 值 : ERD, Wx[Blo; 否则 ， 返 回 错误 编号 

pthread mutexattr init 函数 将 用 默认 的 互 斥 量 属 性 初始 化 
pthread, mutexattr t 结 构 。 值 得 注意 的 3 个 属性 是 : 进程 共享 属性 、 健 壮 
属性 以 及 类 型 属性 。POSIX.1 中 ， 进 程 共享 属性 是 可 选 的。 可 以 通过 检 

duis XE X. T POSIX THREAD PROCESS SHARED 符号 来 判 
MXA F R EnA TE, HAD ABATE 
_SC_THREAD_PROCESS_SHARED Z2 tík 24 sysconf EN ZI XE ÍTR A ° 
RAA D E A SB POSIX ENEAS BRE ZR DD i te FRAY, (Ae 
Single UNIX Specification 要 求 遵循 XSI 标 准 的 操作 系统 文 持 这 个 选项 。 

在 进程 中 ， 多 个 线程 可 以 访问 同一 个 同步 对 象 。 正 如 在 第 11 章 中 
看 到 的 ， 这 是 默认 的 行为 。 在 这 种 情况 下 ， 进 程 共享 互 斥 量 属性 需 设 
置 为 PTHREAD_PROCESS_PRIVATE ° 

我 们 将 在 第 14 章 和 第 15 章 中 看 到 ， 存 在 这 样 的 机 制 : 允许 相互 独 
立 的 多 个 进程 把 同一 个 内 存 数据 块 映 射 到 它们 各 目 独 立 的 地 址 空间 
中 。 就 像 多 个 线程 访问 共享 数据 一 样 ， 多 个 进程 访问 共享 数据 通常 也 
需要 同步 。 如 果 进 程 共 享 互 不 量 属 性 设置 为 
PTHREAD_PROCESS_SHARED， 从 多 个 进程 彼此 之 间 共 享 的 内 存 数 
据 块 中 分 配 的 互 不 量 束 可 以 用 于 这 些 进程 的 同步 。 

HJ LA fE Fd pthread_mutexattr_getpshared ER 2 Æ W) pthread, mutexattr. t 
结构 ， 得 到 它 的 进程 共享 属性 ， 使 用 pthread_mutexattr_setpshared 函 数 
修改 进程 共享 属性 。 

#include <pthread.h> 


int pthread_mutexattr_getpshared(const pthread_mutexattr_t 
*restrict attr, 
int *restrict pshared); 


int pthread_mutexattr_setpshared(pthread_mutexattr_t *attr, 


int pshared); 
两 个 图 数 的 返回 值 : ERD, eo; 否则 ， 返 回 错误 编号 
进程 共享 互 不 量 属性 设置 为 PTHREAD_PROCESS_PRIVATE 时 ， 
允许 pthread 线 程 库 提 供 更 有 效 的 互 斥 量 实现 ， 这 在 多 线程 应 用 程序 中 
是 默认 的 情况 。 在 多 个 进程 共 圣 多 个 互 不 量 的 情况 下 ， pthread 线 程 库 
可 以 限制 开销 较 大 的 互 不 量 实现 。 

互 斥 量 健壮 属性 与 在 多 个 进程 间 共 享 的 互 斥 量 有 关 。 这 意味 着 ， 
当 持 有 互 不 量 的 进程 终止 时 ， 需 要 解决 互 不 量 状态 恢复 的 问题 。 这 种 
情况 发 生 时 ， 互 斥 量 处 于 锁定 状态 ， 恢 复 起 来 很 困难 。 其 他 阻塞 在 这 
个 锁 的 进程 将 会 一 直 阻 塞 下 去 。 

可 以 使 用 pthread_mutexattr_getrobust 函数 获取 健壮 的 互 斥 量 属 性 
的 值 。 可 以 调用 pthread_mnutexattr_setrobust 函 数 设置 健壮 的 互 斥 量 属 性 
的 值 。 

#include <pthread.h> 


int pthread_mutexattr_getrobust(const pthread_mutexattr_t 
*restrict attr, 
int *restrict robust); 
int pthread_mutexattr_setrobust(pthread_mutexattr_t *attr, 
int robust); 
两 个 图 数 的 返回 值 : ERD, eo; 否则 ， 返 回 错误 编号 
健壮 属性 取 值 有 两 种 可 能 的 情况 。 默 认 值 是 
PTHREAD_MUTEX_STALLED， 这 意味 着 持 有 互 不 量 的 进程 终止 时 不 
i UM 这 种 情况 下 ， 使 用 互 斥 量 后 的 行为 是 未 定义 
的 ， 等 待 该 互 斥 量 解锁 的 应 用 程序 会 被 有 效 地 “ 拖 住 ”>。 另 一 个 取 值 是 
PTHREAD MUTEX ROBUST » 这 个 值 将 导致 线程 调用 
pthread_mutex_lock 获 取 锁 ， EM MONS ， 但 它 终止 时 并 
没有 对 该 锁 进 行 解 锁 ， 此 时 线程 会 阻 奢 ， 从 pthread_mnutex_lock 返 回 的 


值 为 ECOWNERDEAD 而 不 是 0。 应 用 程序 可 以 通过 这 个 特殊 的 返回 值 获 
知 ， 若 有 可 能 〈 要 保护 状态 的 细 下 以 及 如 何 进 行 恢 复 会 因 不 同 的 应 用 
程序 而 异 ) ， 不 管 它们 保护 的 互 斥 量 状态 如 何 ， 都 需要 进行 恢复 。 

使 用 健壮 的 互 不 量 改 变 了 我 们 使 用 pthread_mutex_lock 的 方式 ， 
为 现在 必须 检查 3 个 返回 值 而 不 是 之 前 的 两 个 : 不 需要 恢复 的 成 功 、 需 
要 恢复 的 成 功 以 及 失败 。 但 是 ， 即 使 不 用 健壮 的 互 斥 量 ， 也 可 以 只 检 
得 成 功 或 者 失败 。 

在 本 书 的 4 个 平台 中 ， 只 有 Linux 3.2.0 目 前 支持 健壮 的 线程 互 不 
量 。Solaris 10 只 在 它 的 Solaris 线 程 库 中 文 持 健壮 的 线程 互 斥 量 (参阅 
Solaris 手 册 的 mutex_init(3C) 获 取 相 关 的 信息 ) 。 但 是 Solaris 11 支 持 健 
壮 的 线程 互 不 量 。 

如 果 应 用 状态 无 法 恢复 ， 在 线程 对 互 斥 量 解锁 以 后 ， 该 互 斥 量 将 
处 于 永久 不 可 用 状态 。 为 了 避免 这 样 的 问题 ， 线 程 可 以 调用 
pthread mutex consistent 函数 ， 指 明 与 该 互 斥 量 相关 的 状态 在 互 斥 量 解 
锁 之 前 是 一 致 的 。 

#include <pthread.h> 


int pthread_mutex_consistent(pthread_mutex_t *mutex); 
返回 值 : Aa, Relo; AM, RER 
如 果 线 程 没有 先 调 用 pthread mutex consistent EU] 4 FR eit 47 T 
fz i, ABA RE E R I E IR RB BA E ES fa Bl FS RG 
ENOTRECOVERABLE ° 如果 发 生 这 种 情况 ， 互 不 量 将 不 再 可 用 。 线 
程 通过 提前 调用 pthread_mutex_consistent， 能 让 互 斥 量 正常 工作 ， 这 样 
它 惑 可 以 持续 被 使 用 。 
类 型 互 斥 量 属 性 控制 着 互 斥 量 的 锁定 特性 。POSIX.1 定 义 了 4 种 类 
PTHREAD MUTEX NORMAL 一 种 标准 互 不 量 类 型 ， 不 做 任何 特 
殊 的 错误 检查 或 死 锁 检 测 。 
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SEM 


PTHREAD MUTEX ERRORCHECK 此 互 斥 量 类 型 提供 错误 检 


Ir 


PTHREAD MUTEX RECURSIVE 此 互 斥 量 类 型 允许 同一 线程 在 
互 不 量 解锁 之 前 对 该 互 不 量 进行 多 次 加 锁 。 递 归 互 不 量 维护 锁 的 计 
数 ， 在 解锁 次 数 和 加 锁 次 数 不 相 同 的 情况 下 ， 不 会 释放 锁 。 所 以 ， 如 
末 对 一 个 递归 互 斥 量 加 锁 两 次 ， 然 后 解锁 一 次 ， 那 么 这 个 互 斥 量 将 依 
然 处 于 加 锁 状 态 ， 对 它 再 次 解锁 以 前 不 能 释放 该 锁 。 

PTHREAD MUTEX DEFAULT 此 互 斥 量 类 型 可 以 提供 默认 特性 和 
行为 。 操 作 系 统 在 实现 它 的 时 候 可 以 把 这 种 类 型 目 由 地 英 射 到 其 他 互 
斥 量 类 型 中 的 一 种 。 例 如 ，Linux 3.2.0 把 这 种 类 型 映射 为 普通 的 互 斥 量 
类 型 ， 而 FreeBSD 8.0 则 把 它 映 射 为 错误 检查 互 斥 量 类 型 。 

这 4 种 类 型 的 行为 如 图 12-5 所 示 。“ 不 占用 时 解锁 ”这 一 栏 指 的 是 ， 
一 个 线程 对 被 男 一 个 线程 加 锁 的 互 不 量 进行 解锁 的 情况 。“ 在 已 解锁 时 
解锁 ”这 一 栏 指 的 是 ， 当 一 个 线程 对 已 经 解锁 的 互 斥 量 进行 解锁 时 将 会 
发 生 什 么 ， 这 通常 是 编码 错误 引起 的 。 


互 斥 量 类 型 没有 解锁 时 重新 加 锁 ? 不 占用 时 解锁 ? 在 己 解 锁 时 解锁 ? 


PTHREAD MUTEX NORMAL 死 锁 未 定义 未 定义 


PTHREAD MUTEX ERRORCHECK 返回 错误 返回 错误 返回 错误 
PTHREAD MUTEX RECURSIVE 允许 返回 错误 返回 错误 
PTHREAD MUTEX DEFAULT 未 定义 未 定义 未 定义 


图 12-5 互 斥 量 类 型 行为 

RJ LA Hi pthread. mutexattr. gettype & 20 44 $ E Fe 2S 7 Jes PE, A 
pthread_mutexattr_settype 函 数 修 改 互 斥 量 类 型 属性 。 

#include <pthread.h> 


int pthread_mutexattr_gettype(const ^X pthread mutexattr t*restrict 
attr,int*restrict type); 


int pthread mutexattr settype(pthread mutexattr t *attr, int type); 


两 个 函数 的 返回 值 : 看 成 功 ， 返 回 0; AM, wR T 

回忆 11.6.6 万 中 学 过 的 ， 互 斥 量 用 于 保护 与 条 件 变 量 天 联 的 条 
件 。 在 阻塞 线程 之 前 ，pthread_cond_wait 和 pthread_cond_timedwait 函 数 
释放 与 条 件 相 天 的 互 不 量 。 这 就 允许 其 他 线程 获取 互 不 量 、 改 变 条 
件 、 释 放 互 不 量 以 及 给 条 件 变 量 发 信和 号。 有 既然 改变 条 件 时 必须 占有 互 
不 量 ,， 使 用 递归 互 不 量 就 不 是 一 个 好 主意 。 如 有 果 递 归 互 不 量 被 多 次 加 
尔 ， 然 后 用 在 调用 pthread_cond_wait 罚 数 中 ， 那 么 条 件 永 远 都 不 会 得 到 
满足 ， 因 为 pthread_cond_wait 所 做 的 解锁 操作 并 不 能 释放 互 不 量 。 

如 果 需 要 把 现 有 的 单线 程 接口 放 到 多 线程 环境 中 ， 递 归 互 斥 量 是 
非常 有 用 的 ， 但 由 于 现 有 程序 兼容 性 的 限制 ， 不 能 对 函数 接口 进行 修 
改 。 然 而 ， 使 用 递归 锁 可 能 很 难处 理 ， 因 此 应 该 只 在 没有 其 他 可 行 方 
案 的 时 候 才 使 用 它们 。 

实例 

图 12-6 描 述 了 一 种 情况 ， 在 这 种 情况 中 递归 互 斥 量 看 起 来 像 是 在 解 
决 并 发 问题 。 假 设 func1 和 func2 是 函数 库 中 现 有 的 函数 ， 其 接口 不 能 
改变 ， 因 为 存在 调用 这 两 个 接口 的 应 用 程序 ， 而 且 应 用 程序 不 能 改 
动 。 


tone (x) 


pthread mutex lock(x-»lock) 


func2(x) 


pthread mutex unlock(x-»1lock) 


pthread mutex lock(x-»lock) 


pthread mutex unlock(x-»lock) 
图 12-6 使 用 递归 锁 的 一 种 可 能 情况 

为 了 保持 接口 跟 原 来 相同 ， 我 们 把 互 斥 量 和 藤 入 到 了 数据 结构 中 ， 
把 这 个 数据 结构 的 地 址 (x) 作为 参数 传 入 。 这 种 方案 只 有 在 为 此 数据 
结构 提供 分 配 芳 数 时 才 可 行 ， 所 以 应 用 程序 并 不 知道 数据 结构 的 大 小 

(假设 我 们 在 其 中 增加 互 不 量 之 后 必须 扩大 该 数据 结构 的 大 小 ) 。 

如 果 在 最 早 定 义 数 据 结 构 时 ， 预 留 了 足够 的 可 填充 字段 ， 人 允许 把 
某 些 填充 字段 蔡 换 成 互 不 量 ， 这 种 方法 也 是 可 行 的 。 不 过 遗憾 的 是 ， 
大 多 数 程 序 员 并 不 善于 预测 未 来 ， 所 以 这 并 不 是 普遍 可 行 的 实践 。 

如 有 果 funcl1 和 func2 函 数 都 必须 操作 这 个 结构 ， 而 且 可 能 会 有 一 个 以 
上 的 线程 同时 访问 该 数据 结构 ， 那 么 funci 和 func2 必须 在 操作 数据 以 
前 对 互 斥 量 加 锁 。 如 果 funcl 必须 调用 func2， 这 时 如 果 互 斥 量 不 是 递 
归 类 型 的 ， 那 么 束 会 出 现 死 锁 。 如 采 能 在 调用 func2 之 前 释放 互 不 量 ， 


在 func2 返回 后 重新 获取 互 不 量 ， 那 么 就 可 以 避免 使 用 递归 互 不 量 , 但 
这 也 给 其 他 的 线程 提供 了 机 会 ， 其 他 的 线程 可 以 在 funci 执行 期 间 抓 住 
互 不 量 的 控制 ， 修 改 这 个 数据 结构 。 这 也 许 是 不 可 接受 的 ， 当 然 具 体 
的 情况 要 取决 于 互 不 量 试图 提供 什么 样 的 保护 。 

图 12-7 显 示 了 这 种 情况 下 使 用 递归 互 斥 量 的 一 种 蔡 代 方法 。 通 过 提 
B£func2 KAMANA, PZA func2. locked ER 2X , i aes 
func2 Wave nE, EE oe A ER UH E Fez o BE VAAN func2. locked 
RY, ALES ON TERSUR ZR PI PNA, OPS he 
作为 参数 传 入 的 。func2_locked 的 函数 体 包 含 fonc2 的 副本 ，func2 现 在 
只 是 获取 互 斥 量 ， 调 用 func2_locked， 然 后 释放 互 斥 量 。 


main 


funcl(x) ————————»-  funcl 


pthread mutex lock(x-»1lock) 


func2 locked(x) 


pthread mutex unlock(x-»lock) 


func2(x) »] func2 


pthread mutex lock(x-»1lock) 


func2 locked(x) —— ————»  func2 locked 


pthread mutex unlock(x-»lock) 
图 12-7 避免 使 用 递归 锁 的 一 种 可 能 情况 
如 果 并 不 一 定 要 保持 库 画 数 授 口 不 变 ， 束 可 以 在 每 个 函数 中 增加 
二 个 参数 表明 这 个 结构 是 否 被 调用 者 锁定 。 但 是 ， 如 果 可 以 的 话 ， 


傈 持 接 口 不 变通 党 是 更 好 的 选择 ， 可 以 避免 实现 过 程 中 人 为 加 入 的 东 
西 对 原 有 系统 产生 不 民 影 响 。 

提供 加 锁 和 不 加 锁 版 本 的 函数 ， 这 样 的 策略 在 简单 的 情况 下 通常 
是 可 行 的 。 在 更 加 复杂 的 情况 下 ， 比 如 ， 库 需要 调用 库 以 外 的 函数 ， 
而 且 可 能 会 再 次 回调 库 中 的 函数 时 ， 残 需要 依赖 递归 锁 。 

实例 

图 12-8 中 的 程序 解释 了 有 必要 使 用 递归 互 斥 量 的 另 一 种 情况 。 这 
里 ， 有 一 个 “超时 ”(timeout) 函数 ， 它 允许 安排 男 一 个 函数 在 未 来 的 
某 个 时 间 运 行 。 假 设 线程 并 不 是 很 昂贵 的 资源 ， 束 可 以 为 每 个 挂 起 的 
超时 函数 创建 一 个 线程 。 线 程 在 时 间 未 到 时 将 一 直 等 每 ， 时 间 到 了 以 
后 再 调用 请 求 的 范 数 。 


#include "apue.h" 
#include <pthread.h> 
#include <time.h> 
#include <sys/time.h> 


extern int makethread(void *(*)(void *), void *); 


struct to info { 


void (*to fn)(void *); /* Function; */ 
void *to arg; /* argument */ 
struct timespec to wait; /* time to wait */ 


}; 


#define SECTONSEC 1000000000 /* seconds to nanoseconds */ 


#if !defined(CLOCK REALTIME) || defined (BSD) 


#define clock nanosleep(ID, FL, REQ, REM) nanosleep((REQ), (REM)) 


#endif 


#ifndef CLOCK REALTIME 
#define CLOCK REALTIME 0 
#define USECTONSEC 1000 /* microseconds to nanoseconds */ 


void 
clock_gettime(int id, struct timespec *tsp) 


{ 


struct timeval tv; 


gettimeofday(&tv, NULL); 

tsp->tv_sec = tyv. tyv sec; 

tsp->tv_nsec = tv.tv usec * USECTONSEC; 
} 
#tendif 


void * 
timeout_helper(void *arg) 
{ 


stiute to info tip} 


tip = (struct to info *)arg; 

clock nanosleep(CLOCK REALTIME, 0, &tip-»to wait, NULL); 
(*tip-»to fn) (tip-»to arg); 

free (arg); 

return(0); 


void 
timeout(const struct timespec *when, void (*func) (void *), void *arg) 
{ 

struct timespec now; 

struct to info pane 

int err; 

clock gettime (CLOCK REALTIME, &now); 

if ((when-»5tv sec > now.tv sec) || 

(when-»tv sec == now.tv sec && when->tv_nsec > now.tv nsec)) { 


tip = malloc(sizeof(struct to info)); 
if (tip != NULL) { 
tip->to_fn = func; 


tip->to_arg = arg; 
tip->to_wait.tv_sec = when->tv_sec - now.tv_sec; 
if (when->tv_nsec >= now.tv_nsec) { 
tip->to_wait.tv_nsec = when->tv_nsec - now.tv nsec; 
} else { 
tip->to_wait.tv_sec--; 
tip->to_wait.tv_nsec = SECTONSEC - now.tv nsec + 
when->tv_nsec; 
} 
err = makethread(timeout_helper, (void *)tip); 
if (err == 0) 
return; 
else 
free (tip); 


/* 

* We get here if (a) when <= now, or (b) malloc fails, or 

* (c) we can't make a thread, so we just call the function now. 
d 

(*func) (arg) ; 


pthread mutexattr t attr; 
pthread mutex t mutex; 


void 
retry(void *arg) 
{ 
pthread_mutex_lock (&mutex) ; 


/* perform retry steps ... */ 


pthread mutex unlock(&mutex); 


int 

main (void) 

{ 
int err, condition, arg; 
struct timespec when; 


if ((err = pthread mutexattr init(&attr)) != 0) 
err exit(err, "pthread mutexattr init failed"); 
if ((err = pthread mutexattr settype(&attr, 


PTHREAD MUTEX RECURSIVE)) !- 0) 
err exit(err, "can't set recursive type"); 
if ((err = pthread mutex init(&mutex, &attr)) !- 0) 


err exit(err, "can't create recursive mutex"); 


/* continue processing ... */ 


pthread mutex lock(&mutex); 


/* 
* Check the condition under the protection of a lock to 
* make the check and the call to timeout atomic. 
BÀ 
if (condition) { 
/* 
* Calculate the absolute time when we want to retry. 
cay 
clock_gettime (CLOCK_REALTIME, &when); 
when.tv_sec += 10; /* 10 seconds from now */ 
timeout (&when, retry, (void *) ((unsigned long) arg) ); 
} 


pthread mutex unlock(&mutex); 
/* continue processing ... */ 


exit(0); 


图 12-8 使 用 递归 互 不 量 

如 有 果 我 们 不 能 创建 线程 ， 或 者 安排 贸 数 运行 的 时 间 已 过 ， 这 时 间 
题 束 出 现 了 。 在 这 些 情况 下 ， 我 们 只 需 在 当前 上 下 文中 调用 之 前 请 求 
运行 的 函数 。 因 为 函数 要 获取 的 锁 和 我 们 现在 占有 的 锁 是 同一 个 ， 所 
以 除非 该 锁 是 递归 的 ， 否 则 残 会 出 现 死 锁 。 

在 图 12-4 中 我 们 使 用 makethread 函 数 以 分 离 状态 创建 线程 。 因 为 传 
圳 给 timeout 芳 数 的 func 函 数 参数 将 在 未 来 运行 ， 所 以 我 们 不 希望 一 直 空 
等 线程 结 

可 以 调用 sleep 等 竺 超时 到 期 ， 但 它 提 供 的 时 间 粒 度 是 秒 级 的 。 如 
有 果 硕 望 等 待 的 时 间 不 是 整数 秒 ， 就 需要 用 nanosleep 或 者 clock_nanosleep 
函数 ， 它 们 两 个 提供 了 更 高 精度 的 休 眼 时 间 。 

在 未 定义 CLOCK_REALTIME 的 系统 中 ， 我 们 根据 nanosleep 定 义 
clock_nanosleep ° 然而，FreeBSD 8.0 定义 这 个 符号 文 持 clock_gettime 
和 clock_settime ， 但 并 不 文 持 clock_nanosleep。 (只 有 Linux 3.2.0 和 
Solaris 10 H Bij xz clock nanosleep  ) 

另外 ， 在 未 定义 CLOCK_REALTIME 的 系统 中 ， 我 们 提供 了 我 们 自 
己 的 clock_gettime 实 现 ， 该 实现 调用 了 gettimeofday 并 把 微妙 转换 成 纳 


fb o 

timeout 的 调用 者 需要 占有 互 斥 量 来 检查 SOT. 并 且 把 retry 函 数 安 
排 为 原子 操作 。retry 函 数 试图 对 同一 个 互 斥 量 进 行 加 锁 。 除 非 互 斥 量 
是 递归 的 ， 否 则 ， 如 果 timeout 函数 直接 调用 retry， 会 导致 死 锁 。 


12.4.2 读 写 锁 属 性 


写 锁 与 互 斥 量 类 似 ， 也 是 有 属性 的 。 可 以 用 
MM 4] 始 化 pthread rwlockatr t Zi Tj , 用 
pthread_rwlockattr_destroy 反 初始 化 该 结构 。 

#include <pthread.h> 


int pthread_rwlockattr_init(pthread_rwlockattr_t *attr); 
int pthread_rwlockattr_destroy(pthread_rwlockattr_t *attr); 
两 个 函数 的 返回 值 : 者 成 功 ， 返 回 0; 人 否则， 返回 错误 编号 
读 写 锁 支 持 的 唯一 属性 是 进程 共享 属性 。 它 与 互 不 量 的 进程 共享 
属性 是 相同 的 。 就 像 互 斥 量 的 进程 共享 属性 一 样 ， 有 一 对 函数 用 于 读 
取 和 设置 读 写 锁 的 进程 共享 属性 。 
#include <pthread.h> 


int pthread_rwlockattr_getpshared(const pthread_rwlockattr_t * 

restrict attr, 

int *restrict pshared); 
int pthread_rwlockattr_setpshared(pthread_rwlockattr_t *attr, 

int pshared); 

PY TERA: ERJ, eo; 否则 ， 返 回 错误 编号 
虽然 POSIX 只 定义 了 一 个 读 写 锁 属性 ， 但 不 同 平台 的 实现 可 以 目 
由 地 定义 额外 的 、 非 标准 的 属性 


12.4.3 条 件 变 量 属性 


Single UNIX Specification 目 前 定义 了 条 件 变 量 的 两 个 属性 : 进程 共 
享 属 性 和 时 钟 属性 。 与 其 他 的 属性 对 象 一 样 ， 有 一 对 函数 用 于 初始 化 
和 上 反 初 始 化 条 件 变量 属性 。 

#include <pthread.h> 

int pthread_condattr_init(pthread_condattr_t *attr); 

int pthread_condattr_destroy(pthread_condattr_t *attr); 

两 个 图 数 的 返回 值 : ERD, eo; 否则 ， 返 回 错误 编号 

与 其 他 的 同步 属性 一 样 ， 条 件 变 量 文 持 进程 共享 属性 。 它 控制 着 
条 件 变 量 站 可 以 被 单 进程 的 多 个 线程 使 用 ， 还 是 可 以 被 多 进程 的 线程 
使 用 。 要 获取 进程 共享 属性 的 当前 值 ， 可 以 用 
pthread condattr getpshared K 2X °> 设置 该 值 可 以 用 
pthread condattr setpsharedENZA ° 

#include <pthread.h> 


int pthread_condattr_getpshared(const pthread_condattr_t * 
restrict attr, 
int *restrict pshared); 
int pthread_condattr_setpshared(pthread_condattr_t *attr, 
int pshared); 
两 个 图 数 的 返回 值 : ERD, xeo; 否则 ， 返 回 错误 编号 
时 钟 属性 控制 计算 pthread_cond_timedwait 范 数 的 超时 参数 (tsptr) 
时 采用 的 是 哪个 时 钟 。 合 法 值 取 目 图 6-8 中 列 出 的 时 钟 ID。 可 以 使 用 
pthread_condattr_getclock EX ZA TX BC n] $x AA T pthread. cond. timedwait ER 
数 的 时 钟 ID, ， 在 使 用 pthread cond timedwait 函数 前 需要 用 
pthread condattr t 对 象 对 条 件 变量 进行 初始 化 。 可 以 用 
pthread_condattr_setclock 函 数 对 时 钟 ID 进行 修改 。 
#include <pthread.h> 


int pthread_condattr_getclock(const pthread_condattr_t * 


restrict attr, 
clockid t *restrict clock id); 
int pthread. condattr setclock(pthread condattr t *attr, 
clockid t clock id); 
PIA RARE ae, KIO; 否则 ， 返 回 错误 编号 
奇怪 的 是 ，Single UNIX Specification 并 没有 为 其 他 有 超时 等 竺 函数 
的 属性 对 象 定 义 时 钟 属性 。 


12.4.4 屏障 属性 


屏障 也 有 属性 。 可 以 使 用 pthread_barrierattr_init 函 数 对 屏障 属性 对 
象 进行 初始 化 ， 用 pthread_barrierattr_destroy 函 数 对 屏障 属性 对 象 进行 
反 初 始 化 。 

#include <pthread.h> 


int pthread_barrierattr_init(pthread_barrierattr_t *attr); 
int pthread barrierattr destroy(pthread barrierattr t *attr); 
两 个 图 数 的 返回 值 : ERD, xx[Blo; 否则 ， 返 回 错误 编号 
目前 定义 的 屏障 属性 只 有 进程 共享 属性 ， 它 控制 着 屏障 是 可 以 被 
多 进程 的 线程 使 用 ， 还 是 只 能 被 初始 化 屏障 的 进程 内 的 多 线程 使 用 。 
与 其 他 属性 对 和 象 一 样 ， 有 一 个 获取 属性 值 的 函数 
( pthread_barrierattr_getpshared ) 和 一 个 设置 属性 值 的 函数 
(pthread barrierattr setpshared) ° 


#include <pthread.h> 

int pthread_barrierattr_getpshared(const pthread_barrierattr_t * 
restrict attr, 
int *restrict pshared); 


int pthread_barrierattr_setpshared(pthread_barrierattr_t *attr, 


int pshared); 
两 个 函数 的 返回 值 : ERD, lO; 否则 ， 返 回 错误 编号 
进程 共享 属性 的 值 可 以 是 PTHREAD PROCESS SHARED (多 进 
程 中 的 多 个 线程 可 用 ) ， 也 可 以 是 PTHREAD_PROCESS_PRIVATE 
(只 有 初始 化 屏障 的 那个 进程 内 的 多 个 线程 可 用 ) 。 


12.5 重 入 


10.6 节 讨论 了 可 重 入 函数 和 信号 处 理 程序 。 线 程 在 遇 到 重 入 问题 时 
与 信号 处 理 程序 是 类 似 的 。 在 这 两 种 情况 下 ， 多 个 控制 线程 在 相同 的 
时 间 有 可 能 调用 相同 的 函数 。 

如 有 果 一 个 函数 在 相同 的 时 间 点 可 以 被 多 个 线程 安全 地 调用 ， 怠 称 
该 画 数 是 线程 安全 的 。 在 Single UNIX Specification F 7€ SLAY Ar A EW BY 
中 ， 除 了 图 12-9 中 列 出 的 函数 ， 其 他 函数 都 保证 是 线程 安全 的 。 另 外 ， 
ctermid 和 tmpnam 函 数 在 参数 传 入 空 指针 时 并 不 能 保证 是 线程 安全 的 。 
类 似 地 ， 如 果 参 数 mbstate_t 传 入 的 是 空 指针 ， 也 不 能 保证 wcrtomb 和 
wcsrtombs 函 数 是 线程 安全 的 。 

文 持 线程 安全 函数 的 操作 系统 实现 会 在 <unistdh> 中 定义 符号 
POSIX THREAD SAFE FUNCTIONS ° M H fi FF t PJ DA XEsysconf EN 
数 中 传 入 _SC_THREAD_SAFE_FUNCTIONS 参 数 在 运行 时 检查 是 否 支 
持 线 程 安全 函数 。 在 SUSv4 之 前 ， 要 求 所 有 遵循 XSI 的 实现 都 必须 支持 
线程 安全 函数 ， 但 是 在 SUSv4 中 ， 线 程 安全 画 数 支持 这 个 需求 已 经 要 求 
具体 实现 考虑 遵循 POSIX 。 

操作 系统 实现 支持 线程 安全 函数 这 个 特性 时 ， 对 POSIX.1 中 的 一 些 
非 线程 安 全 画 数 ， 它 会 提供 可 替代 的 线程 安全 版 本 。 图 12-10 列 出 了 这 
些 函 数 的 线程 安全 版 本 。 这 些 画 数 的 命名 方式 与 它们 的 非 线程 安全 版 


本 的 名 字 相 似 ， 只 不 过 在 名 字 最 后 加 了 _r， 表 明 这 些 版 本 是 可 重 入 的 。 
很 多 函数 并 不 是 线程 安全 的 ， 因 为 它们 返回 的 数据 存放 在 静态 的 内 存 
缓 促 区 中 。 通 过 修改 接口 ， 要 求 调 用 者 自己 提供 缓冲 区 可 以 使 画 数 变 


为 线程 安全 。 


basename 
catgets 
crypt 

dbm clearerr 
dbm close 
dbm delete 
dbm error 
dbm fetch 
dbm firstkey 
dbm nextkey 
dbm open 

dbm store 
dirname 
dlerror 
drand48 
encrypt 
endgrent 
endpwent 
endutxent 


getc unlocked 


getchar unlocked 
getdate 

getenv 

getgrent 
getgrgid 
getgrnam 


gethostent 


getlogin 


getnetbyaddr 
getnetbyname 
getnetent 
getopt 
getprotobyname 
getprotobynumber 
getprotoent 
getpwent 
getpwnam 
getpwuid 
getservbyname 


getservbyport 


getservent 
getutxent 
getutxid 
getutxline 
gmtime 
hcreate 
hdestroy 
hsearch 
inet ntoa 
164a 
lgamma 
lgammaf 
lgammal 
localeconv 
localtime 
lrand48 
mrand48 
nftw 


nl langinfo 
ptsname 


getgrgid r 
getgrnam r 
getlogin r 


getpwnam r 


getpwuid r 


gmtime r 


putc unlocked 
putchar unlocked 
putenv 
pututxline 
rand 

readdir 
setenv 
setgrent 
setkey 
setpwent 
setutxent 
strerror 
strsignal 
strtok 

system 
ttyname 
unsetenv 
wcstombs 
wctomb 


图 12-9 POSIX.1 中 不 能 保证 线程 安全 的 函数 


localtime r 
readdir r 

BSUPIGEPOI-r 
BStrtok T 


ttyname r 


图 12-10 替代 的 线程 安全 函数 

如 采 一 个 函数 对 多 个 线程 来 说 是 可 重 入 的 ， 束 说 这 个 函数 承 是 线 
程 安 全 的 。 但 这 并 不 能 说 明 对 信和 号 处 理 程序 来 说 该 函数 也 是 可 重 入 
的 。 如 果 函 数 对 异步 信号 处 理 程序 的 重 入 是 安全 的 ， 那 么 承 可 以 说 函 
数 是 异步 信号 安全 的 。 我 们 在 10.6 节 中 讨论 可 重 入 函数 时 ， 图 10-4 中 的 
Ex BC RH S CAS ERN © 

除了 图 12-10 中 列 出 的 函数 ，POSIX.1 还 提供 了 以 线程 安全 的 方式 
管理 FILE 对 象 的 方法 。 可 以 使 用 flockfile 和 ftrylockfile 获 取 给 定 FILE 对 
象 关 联 的 锁 。 这 个 锁 是 递归 的 : 当 你 占有 这 把 锁 的 时 候 ， 还 是 可 以 再 
次 获取 该 锁 ， 而 且 不 会 导致 死 锁 。 虽 然 这 种 锁 的 具体 实现 并 无 规定 ， 
但 要 求 所 有 操作 FILE 对 象 的 标准 VO 例 程 的 动作 行为 必须 看 起 来 就 像 
它们 内 部 调用 了 flockfile 和 funlockfile。 

#include <stdio.h> 

int ftrylockfile(FILE *fp); 

返回 值 : By, 3R[BO; 大 不 能 获取 锁 ， 返 回 非 0 数值 

void flockfile(FILE *fp); 

void funlockfile(FILE *fp); 

昌 然 标准 的 MO 例 程 可 能 从 它们 各 自 的 内 部 数据 结构 的 角度 出 发 ， 
是 以 线程 安全 的 方式 实现 的 ， 但 有 时 把 锁 开 放 给 应 用 程序 也 是 非常 有 
用 的 。 这 人 允许 应 用 程序 把 多 个 对 标准 MO 函数 的 调用 组 合成 原子 序列 。 
当然 ， 在 处 理 多 个 FILE 对 象 时 ， 需 要 注意 潜在 的 死 锁 ， 需 要 对 所 有 的 
锁 仔 细 地 排序 。 

如 采 标 准 IMO 例 程 都 获取 它们 各 目的 锁 ， 那 么 在 做 一 次 一 个 字符 的 
1/O 时 就 会 出 现 严重 的 性 能 下 降 。 在 这 种 情况 下 ， 需 要 对 每 一 个 字符 的 
读 写 操作 进行 获取 锁 和 释放 锁 的 动作 。 为 了 避免 这 种 开销 ， 出 现 了 不 
加 锁 厂 本 的 基于 字符 的 标准 MO 例 程 。 


include <stdio.h> 


int getchar unlocked(void); 

int getc unlocked(FILE *fp); 

两 个 画 数 的 返回 值 : 若 成 功 ， 返 回 下 一 个 字符 ， 若 遇 到 文件 尾 或 者 出 
错 ， 返 回 EOF 


int putchar_unlocked(int c); 
int putc_unlocked(int c, FILE *fp); 
两 个 函数 的 返回 值 : ARJ, wE Auta, 3R[SIEOF 

除非 被 flockfile (或 ftrylockfile) 和 funlockfile 的 调用 包围 ， 否 则 尽 
量 不 要 调用 这 4 个 函数 ， 因 为 它们 会 导致 不 可 预期 的 结果 (比如 ， 由 于 
多 个 控制 线程 非 同步 访问 数据 引起 的 种 种 问题 ) 

一 旦 对 FILE 对 象 进行 加 锁 ， 就 可 以 在 释放 锁 之 前 对 这 些 函 数 进行 
多 次 调用 。 这 样 承 可 以 在 多 次 的 数据 读 写 上 分 摊 总 的 加 解锁 的 开销 。 

实例 

图 12-11 显 示 了 getenv ( 见 7.9 节 ) 的 一 个 可 能 实现 。 这 个 版 本 不 是 
可 重 入 的 。 如 条 两 个 线程 同时 调用 这 个 函数 ， 束 会 看 到 不 一 致 的 结 
果 ， 因 为 所 有 调用 getenv 的 线程 返回 的 字符 串 都 存储 在 同一 个 静态 缓冲 
[X FB 9 


#include «limits.h» 
finclude <string.h> 


#define MAXSTRINGSZ 4096 
static char envbuf[MAXSTRINGSZ]; 
extern char **environ; 

char * 


getenv(const char *name) 


{ 


int i, len; 


len = strlen (name); 
for (i = 0; environ[i] != NULL; i++) { 
if ((strncmp (name, environ[i], len) == 0) && 
(environ[i] [len] == '="')) { 


strncpy(envbuf, &environ[i][len*1], MAXSTRINGSZ-1); 
return(envbuf); 
} 
} 
return (NULL) ; 


图 12-11 getenv 的 非 可 重 入 版 本 

图 12-12 给 出 了 getenv 的 可 重 入 的 版 本 。 这 个 版 本 叫做 getenv_r。 它 
(E F]pthread. onceER ZI HA PAP es & >A RR [RTI v US A getenv r, BES 
TER Mi H thread initk 2 —1X ° 12.677 21-20 fi wtpthread_onceLN RY ° 


#include <string.h> 
#include <errno.h> 
#include <pthread.h> 
#include <stdlib.h> 


extern char **environ; 


pthread_mutex_t env_mutex; 


static pthread_once_t init_done = PTHREAD_ONCE_INIT; 


static void 
thread_init (void) 
{ 
pthread_mutexattr_t attr; 


pthread mutexattr init(&attr); 

pthread mutexattr settype(&attr, PTHREAD MUTEX RECURSIVE); 
pthread mutex init(&env mutex, &attr); 

pthread mutexattr destroy(&attr); 


int 
getenv r(const char *name, char *buf, int buflen) 
{ 


int i, len, olen; 


pthread_once(&init_done, thread_init); 
len = strlen(name) ; 
pthread_mutex_lock (&env_mutex) ; 


for (i = 0; environ[i] != NULL; i++) { 
if ((strncmp(name, environ[i], len) == 0) && 
(environ[i] [len] == '=')) { 


olen = strlen(&environ[i][len-*1]); 
if (olen >= buflen) { 
pthread mutex unlock(&env mutex); 
return (ENOSPC); 
) 
strcpy (buf, &environ[i] [len+1]); 
pthread mutex unlock(&env mutex); 
return(0); 


) 
pthread mutex unlock(&env mutex); 
return (ENOENT) ; 


图 12-12 getenv 的 可 重 入 (线程 安全 ) 版 本 

要 使 getenv_ r 可 重 入 ， 需 要 改变 接口 ， 调 用 者 必须 提供 它 自己 的 组 
冲 区 ， 这 样 每 个 线程 可 以 使 用 各 目 不 同 的 缓冲 区 避免 其 他 线程 的 干 
扰 。 但 是 ， 注 意 ， 要 想 使 getenv_r 成 为 线程 安全 的 ， 这 样 做 还 不 够 ， 需 


要 在 搜索 请 求 的 字符 时 保护 环境 不 被 修改 。 可 以 使 用 互 斥 量 ， 通 过 
getenv_r 和 putenv 函 数 对 环境 列表 的 访问 进行 串 行 化 。 

可 以 使 用 读 写 锁 ， 从 而 允许 对 getenv_T 进 行 多 次 并 发 访问 ， 但 增加 
的 并 发 性 可 能 并 不 会 在 很 大 程度 上 改善 程序 的 性 能 ， 这 里 面 有 两 个 原 
Al: 第 一 ， 环 境 列表 通常 并 不 会 很 长 ， 所 以 扫描 列表 时 并 不 需要 长 时 
inca aes; 第 二 ， 对 getenv 和 putenv 的 调用 也 不 是 频繁 发 生 的 ， 
所 以 改善 它们 的 性 能 并 不 会 对 程序 的 整体 性 能 产生 很 大 的 影响 。 

即使 可 以 把 getenv_r 变 成 线程 安全 的 ， 这 也 不 意味 着 它 对 信号 处 理 
程序 是 可 重 入 的 。 如 果 使 用 的 是 非 递归 的 互 斥 量 ， 线 程 从 信和 号 处 理 程 
序 中 调用 getenv 就 有 可 能 出 现 死 锁 。 如 果 信 和 号 处 理 程序 在 线程 执行 
getenv_r 时 中 断 了 该 线程 ， 这 时 我 们 已 经 占有 加 锁 的 env_mutex， 这 样 
其 他 线程 试图 对 这 个 互 斥 量 的 加 锁 丈 会 被 阻塞 ， 最 终 导致 线程 进入 和 死 
锁 状 态 。 所 以 ， 必 须 使 用 递归 互 斥 量 阻 止 其 他 线程 改变 我 们 正 需 要 的 
数据 结构 ， 还 要 阻止 来 自信 号 处 理 程序 的 死 锁 。 问 题 是 pthread 函 数 并 
不 保证 是 异步 信号 安全 的 ， 所 以 不 能 把 pthread 函 数 用 于 其 他 函数 ， 让 
该 图 数 成 为 异步 信号 安全 的 。 


12.6 线程 


线程 特定 数据 (thread-specific data) ， 也 称 为 线程 私有 数据 
(thread-private data) ， 是 存储 和 查询 某 个 特定 线程 相关 数据 的 一 种 机 
制 。 我 们 把 这 种 数据 称 为 线程 特定 数据 或 线程 私有 数据 的 原因 是 ， 我 
们 希望 每 个 线程 可 以 访问 它 自 己 单独 的 数据 副本 ， 而 不 需要 担心 与 其 
他 线程 的 同步 访问 问题 。 
线程 模型 促进 了 进程 中 数据 和 属性 的 共享 ， 许 多 人 在 设计 线程 模 
型 时 会 遇 到 各 种 磋 烦 。 那 么 为 什么 有 人 和 想 在 这 样 的 模型 中 促进 阻止 共 


享 的 接口 呢 ? 这 其 中 有 两 个 原因 。 

第 一 ， 有 时 候 需 要 维护 基于 每 线程 (perthread) 的 数据 。 因 为 线 
程 ID 并 不 能 保证 是 小 而 连续 的 整数 ， 所 以 束 不 能 简单 地 分 配 一 个 每 线 
程 数据 数组 ， 用 线程 ID 作为 数组 的 索引 。 即 使 线程 ID 确实 是 小 而 连续 
的 整数 ， 我 们 可 能 还 希望 有 一 些 额 外 的 保护 ， 防 止 菜 个 线程 的 数据 与 
其 他 线程 的 数据 相 混 清 。 

采用 线程 私有 数据 的 第 二 个 原因 是 ， 它 提供 了 让 基于 进程 的 接口 
适应 多 线程 环境 的 机 制 。 一 个 很 明显 的 实例 就 是 ermo。 回 忆 1.7 广 中 对 
errno 的 讨论 。 以 前 的 接口 (线程 出 现 以 前 把 errno 定义 为 进程 上 下 文 
中 全 局 可 访问 的 整数 。 系 统 调用 和 库 例 程 在 调用 或 执行 失败 时 设置 
errno， 把 它 作为 操作 失败 时 的 附属 结果 。 为 了 让 线程 也 能 够 使 用 那些 
原本 基于 进程 的 系统 调用 和 库 例 程 ，errmno 被 重 狐 定义 为 线程 私有 数 
据 。 这 样 ， 一 个 线程 做 了 重 置 errno 的 操作 也 不 会 影响 进程 中 其 他 线程 
的 errno 值 。 

我 们 知道 一 个 进程 中 的 所 有 线程 都 可 以 访问 这 个 进程 的 整个 地 址 
空间 。 除 了 使 用 寄存 右 以 外 ， 一 个 线程 没有 办 法 阻止 另 一 个 线程 访问 
它 的 数据 。 线 程 特定 数据 也 不 例外 。 虽 然 底 层 的 实现 部 分 并 不 能 阻止 
这 种 访问 能 力 ， 但 管理 线程 特定 数据 的 函数 可 以 提高 线程 间 的 数据 独 
立 性 ， 使 得 线程 不 太 容 易 访 问 到 其 他 线程 的 线程 特定 数据 。 

在 分 配 线程 特定 数据 之 前 ， 需 要 创建 与 该 数据 关联 的 键 。 这 个 键 
将 用 于 获取 对 线程 特定 数据 的 访问 。 使 用 pthread_key_create 创 建 一 个 
$E o 

#include <pthread.h> 


int pthread_key_create(pthread_key_t *keyp, void (*destructor)(void 
9) 
返回 值 ， 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


创建 的 键 存 储 在 keyp 指 向 的 内 存单 元 中 ， 这 个 键 可 以 被 进程 中 的 
所 有 线程 使 用 ， 但 每 个 线程 把 这 个 键 与 不 同 的 线程 特定 数据 地 址 进行 
关联 。 创 建新 键 时 ， 每 个 线程 的 数据 地 址 设 为 空 值 。 

除了 创建 键 以 外 ，pthread_key_create 可 以 为 该 键 关 联 一 个 可 选择 
的 析 构 函数 。 当 这 个 线程 退出 时 ， 如 采 数 据 地 址 已 经 被 置 为 非 空 值 ， 
那么 析 构 函数 就 会 被 调用 ， 它 唯一 的 参数 就 是 该 数据 地 址 。 如 果 传 入 
的 析 构 函数 为 空 ， 束 表明 没有 析 构 函数 与 这 个 键 关 联 。 当 线程 调用 
pthread_exit 或 者 线程 执行 返回 ， 正 党 退出 时 ， 析 构 函 数 就 会 被 调用 。 
同样 ， 线 程 取消 时 ， 只 有 在 最 后 的 清理 处 理 程序 返回 之 后 ， 析 构 函 数 
会 被 调用 。 如 果 线 程 调 用 了 exit、_exit、_Exit 或 abort， 或 者 出 现 其 他 
非 正 常 的 退出 时 ， 就 不 会 调用 析 构 函数 。 

线程 通常 使 用 malloc 为 线程 特定 数据 分 配 内 存 。 析 构 函 数 通常 释放 
已 分 配 的 内 存 。 如 果 线 程 在 没有 释放 内 存 之 前 就 退出 了 ， 那 么 这 块 内 
存 束 会 丢失 ， 即 线程 所 属 进 程 就 出 现 了 内 存 泄漏 。 

线程 可 以 为 线程 特定 数据 分 配 多 个 键 ， 每 个 键 都 可 以 有 一 个 析 构 
函数 与 它 关 联 。 每 个 键 的 析 构 函数 可 以 互 不 相同 ， 当 然 所 有 键 也 可 以 
使 用 相同 的 析 构 函数 。 每 个 操作 系统 实现 可 以 对 进程 可 分 配 的 键 的 数 
量 进 行 限制 〈 回 忆 一 下 图 12-1 中 的 PTHREAD_KEYS_MAX) 。 

线程 退出 时 ， 线 程 特定 数据 的 析 构 函数 将 按照 操作 系统 实现 中 定 
义 的 顺序 被 调用 。 析 构 函 数 可 能 会 调用 男 一 个 钞 数 ， 该 范 数 可 能 会 创 
建新 的 线程 特定 数据 ， 并 且 把 这 个 数据 与 当前 的 键 关联 起 来 。 当 所 有 
的 析 构 函数 都 调用 完成 以 后 ， 系 统 会 检查 是 否 还 有 非 空 的 线程 特定 数 
据 值 与 键 关联 ， 如 果 有 的 话 ， 再 次 调用 析 构 函数 。 这 个 过 程 将 会 一 直 
重复 直到 线程 所 有 的 键 都 为 空 线 程 特定 数据 值 ， 或 者 已 经 做 了 
PTHREAD DESTRUCTOR ITERATIONS ( 见 图 12-1) 中 定义 的 最 大 次 
数 的 尝试 。 


对 所 有 的 线程 ， 我 们 都 可 以 通过 调用 pthread_key_delete 来 取消 键 与 
线程 特定 数据 值 之 间 的 关联 关系 。 

#include <pthread.h> 

int pthread_key_delete(pthread_key_t key); 

返回 值 : Aa, elo; 和 否则， 返回 错误 编号 

注意 ， 调 用 pthread key _delete 并 不 会 激活 与 键 关 联 的 析 构 函数 。 要 
释放 任何 与 键 关 联 的 线程 特定 数据 值 的 内 存 ， 需 要 在 应 用 程序 中 采取 
额外 的 步骤 。 

需要 确保 分 配 的 键 并 不 会 由 于 在 初始 化 阶段 的 竞争 而 发 生变 动 。 
下 面 的 代码 会 导致 两 个 线程 都 调用 pthread_key_create ° 


void destructor(void *); 


pthread key. t key; 
int init done = 0; 
int 
threadfunc(void *arg) 
{ 
if ('tinit done) { 
init done = 1; 


err = pthread key create(&key, destructor); 


} 

有 些 线程 可 能 看 到 一 个 键 值 ， 而 其 他 的 线程 看 到 的 可 能 是 另 一 个 
不 同 的 键 值 ， 这 取决 于 系统 是 如 何 调 度 线程 的 ， 解 决 这 种 竞争 的 办 法 
是 使 用 pthread_once ° 

#include <pthread.h> 

pthread once t initflag = PTIHREAD_ONCE_INIT; 


int pthread once(pthread once t *initflag, void (*initfn)(void)); 
返回 值 : AA, Reo; 否则 ， 返 回 错误 编号 
initflag 必须 是 一 个 非 本 地 变量 (如 全 局 变量 或 静态 变量 ) ， 而 且 
必须 初始 化 为 PTHREAD_ONCE INIT ° 
如 果 每 个 线程 都 调用 pthread_once， 系 统 就 能 保证 初始 化 例 程 initfn 
只 被 调用 一 次 ， 即 系统 首次 调用 pthread_once 时 。 创 建 键 时 避免 出 现 冲 
突 的 一 个 正确 方法 如 下 : 


void destructor(void *); 


pthread key. t key; 
pthread once t init done = PTHREAD ONCE INIT; 
void 
thread  init(void) 
{ 
err = pthread_key_create(&key, destructor); 
} 
int 
threadfunc(void *arg) 
{ 
} 


pthread_once(&init_done, thread_init); 


键 一 旦 创建 以 后 ， 就 可 以 通过 调用 pthread_setspecific 芳 数 把 键 和 线 
程 特定 数据 关联 起 来 。 可 以 通过 pthread_getspecific 函 数 获得 线程 特定 数 
据 的 地 址 。 

#include <pthread.h> 

void *pthread_getspecific(pthread_key_t key); 


返回 值 : 线程 特定 数据 值 ;， ANAS VABEAREX, JEIBINULL 


int pthread setspecific(pthread key. t key, const void *value); 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 

如 果 没 有 线程 特定 数据 值 与 键 天 联 ，pthread_getspecific 将 返回 一 个 
空 指 针 ， 我 们 可 以 用 这 个 返回 值 来 确定 是 否 需要 调用 
pthread setspecific ° 

实例 

图 12-11 给 出 了 getenv 的 假设 实现 。 接 着 又 给 出 了 一 个 新 的 接口 ， 
提供 的 功能 相同 ， 不 过 它 是 线程 安全 的 ( 见 图 12-12) 。 但 是 如 果 不 修 
改 应 用 程序 ， 直 接 使 用 新 的 接口 会 出 现 什么 问题 呢 ? 这 种 情况 下 ， 可 
以 使 用 线程 特定 数据 来 维护 每 个 线程 的 数据 缓冲 区 副本 ， 用 于 存放 各 
目的 返回 字符 串 ， 如 图 12-13 所 示 。 


include «limits.h» 


include <pthread.h> 


# 
#include <string.h> 
# 
#include <stdlib.h> 


#define MAXSTRINGSZ 4096 


Static pthread key t key; 
Static pthread once t init done - PTHREAD ONCE INIT; 
pthread mutex t env mutex - PTHREAD MUTEX INITIALIZER; 


extern char **environ; 


static void 
thread init(void) 
( 
pthread key create(&key, free); 
) 


char * 
getenv(const char *name) 
{ 
int i, len; 
char *envbuf; 


pthread once(&init done, thread init); 
pthread mutex lock(&env mutex); 


envbuf = (char *)pthread getspecific (key); 
if (envbuf == NULL) { 

envbuf = malloc (MAXSTRINGSZ) ; 

if (envbuf == NULL) { 


pthread_mutex_unlock (&env_mutex) ; 
return (NULL) ; 
} 
pthread setspecific(key, envbuf); 
) 


len = strlen (name); 
for (i = 0; environ[i] != NULL; i++) { 
if ((strncmp (name, environ[i], len) == 0) && 


(environ[i] [len] == '=')) { 

strncpy(envbuf, &environ[i] [len+1], MAXSTRINGSZ-1); 

pthread_mutex_unlock (&env_mutex) ; 

return (envbuf) ; 

} 

} 
pthread_mutex_unlock (&env_mutex) ; 
return (NULL); 


图 12-13 线程 安全 的 getenv 的 兼容 版 本 


我 们 使 用 pthread_once 来 确保 只 为 我 们 将 使 用 的 线程 特定 数据 创 
建 一 个 键 。 如 果 pthread_getspecific 返回 的 是 空 指 针 ， 就 需要 先 分 配 内 
存 缓冲 区 ， 然 后 再 把 键 与 该 内 存 缓冲 区 关联。 否则 ， 如 有 果 返 回 的 不 是 
空 指针 ， 束 使 用 pthread_getspecific 返 回 的 内 存 绥 冲 区 。 对 析 构 函数 ， 使 


用 free 来 释放 之 前 由 malloc 分 配 的 内 存 。 只 有 当 线 程 特定 数据 值 为 非 空 
上 时， 析 构 函数 才 会 被 调用 。 

注意 ， 虽 然 这 个 版 本 的 getenv 是 线程 安全 的 ， 但 它 并 不 是 异步 信和 号 
安全 的 。 对 信和 号 处 理 程序 而 言 ， 即 使 使 用 递归 的 互 斥 量 ， 这 个 版 本 的 
getenv 也 不 可 能 是 可 重 入 的 ， 因 为 它 调用 了 malloc， 而 malloc 函 数 本 导 
并 不 是 异步 信号 安全 的 。 


12.7 取消 选项 


有 两 个 线程 属性 并 没有 包含 在 pthread_attr_t 结 构 中 ， 它 们 是 可 取消 
状态 和 可 取消 类 型 。 这 两 个 属性 影响 着 线程 在 啊 应 pthread_cancel 函 数 
调用 时 所 呈现 的 行为 〈《 见 11.5 节 ) 

可 取消 状态 属性 可 以 是 PTHREAD_CANCEL_ENABLE， 也 可 以 是 
PTHREAD_CANCEL_DISABLE ° 线程 可 以 通过 调用 
pthread_setcancelstate 修 改 它 的 可 取消 状态 。 

#include <pthread.h> 

int pthread_setcancelstate(int state, int *oldstate); 

返回 值 : AAD, Eo; 否则 ， 返 回 错误 编号 

pthread_setcancelstate 把 当前 的 可 取消 状态 设置 为 state， 把 原来 的 可 
取消 状态 存储 在 由 oldstate 指 疝 的 内 存单 元 ， 这 两 步 吓 一 个 原子 操作 。 

回忆 11.5 方 ，pthread_cancel 调 用 并 不 等 待 线 程 终止 。 在 默认 情况 
下 ， 线 程 在 取消 请 求 发 出 以 后 还 是 继续 运行 ， 直 到 线程 到 达 某 个 取消 
点 。 取 消 点 是 线程 检查 它 是 否 补 取消 的 一 个 位 置 ， 如 果 取 消 了 人， 则 按 
照 请 求 行 事 。POSIX.1 保 证 在 线程 调用 图 12-14 中 列 出 的 任何 国 数 时 ， 
取消 点 都 会 出 现 。 
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pthread join 
pthread testcancel 
pwrite 

read 

readv 

recv 

recvfrom 

recvmsg 

select 

sem timedwait 
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图 12-14 POSIX.1 定 义 的 取消 点 


sendto 
sigsuspend 
sigtimedwait 
sigwait 
sigwaitinfo 
sleep 
system 
tcdrain 
wait 

waitid 
waitpid 
write 
writev 


线程 启动 时 默认 的 可 取消 状态 是 PTHREAD_CANCEL ENABLE。 
当 状 态 设 为 PTHREAD CANCEL _DISABLE 时 ， 对 pthread_cancel 的 调 


用 并 不 会 


态 ， 当 取消 状态 再 次 变 为 PTHREAD CANCEL ENABLE 时 ， 


下 一 个 取消 点 上 对 所 有 挂 起 的 取消 请 求 进行 处 理 。 


除了 图 12-14 中 列 出 的 函数 ，POSIX.1 还 指 


数 作 为 可 选 的 取消 点 。 


杀 死 线程 。 相 反 ， 取 消 请 求 对 这 个 线程 来 说 还 处 于 挂 起 状 


线程 将 在 


定 了 图 12-15 中 列 出 的 函 


图 12-15 中 列 出 的 有 些 函 数 并 没有 在 本 书 中 进一步 讨论 ， 例 如 ， 处 
TUB IT ANUS TE FT ERA ENB 


如 果 应 用 程序 在 很 长 的 一 段 时 间 内 都 不 会 调用 图 12-14 或 图 12-15 中 


的 函数 (如 数学 计算 领域 的 应 用 程序 ) ， 


pthread_testcancel 函 数 在 程序 中 添加 自己 的 取消 点 。 
#include <pthread.h> 


void pthread_testcancel(void); 


调用 pthread_testcancel 时 ， 如 果 有 某 个 取消 请 求 正 处 于 挂 起 状态 ， 


而 且 取 消 并 没有 将 为 无 效 ， 那 么 线程 束 会 


置 为 无 效 ，pthread_testcancel 调 用 就 没有 任何 效果 了 。 


被 取消 。 但 是 


那么 你 可 以 调用 


， 如 果 取 消 被 
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图 12-15 POSIX.1 定 义 的 可 选取 消 点 
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pthread_cancel 以 后 ， 在 线程 到 达 取 消 点 之 前 ， 并 不 会 出 现 真正 的 取 
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消 。 可 以 通过 调用 pthread_setcanceltype 来 修改 取消 类 型 。 

#include <pthread.h> 

int pthread_setcanceltype(int type, int *oldtype); 

返回 值 ， 若 成 功 ， 返 回 0;， 否则 ， 返 回 错误 编号 

pthread_setcanceltype HAGE RUE RAE type (类 型 参数 可 以 是 
PTHREADCANCEL DEFERRED ; 也 可 以 是 
PTHREAD CANCEL ASYNCHRONOUS) ， 把 原来 的 取消 类 型 返回 到 
oldtypef&[H] Hy E762 ER 7p o 

异步 取消 与 推迟 取消 不 同 ， 因 为 使 用 异步 取消 时 ， 线 程 可 以 在 任 
意 时 间 撤 消 ， 不 是 非得 遇 到 取消 点 才能 被 取消 。 


12.8 线程 和 信 


即使 是 在 基于 进程 的 编程 范 型 中 ， 信 和 号 的 处 理 有 时 候 也 是 很 复杂 
的 。 把 线程 引入 编程 范 型 ， 就 使 信号 的 处 理 变 得 更 加 复杂 。 

每 个 线程 都 有 和 目 己 的 信号 屏蔽 字 ， 但 是 信和 号 的 处 理 是 进程 中 所 有 
线程 共享 的 。 这 意味 着 单个 线程 可 以 阻止 某 些 信和 号， 但 当 某 个 线程 修 
改 了 与 某 个 给 定 信号 相关 的 处 理 行为 以 后 ， 所 有 的 线程 都 必须 共享 这 
个 处 理 行为 的 改变 。 这 样 ， 如 果 一 个 线程 选择 忽略 某 个 给 定 信 号 ， 那 
么 男 一 个 线程 就 可 以 通过 以 下 两 种 方式 撤消 上 壕 线 程 的 信号 选择 TX 
复 信和 号 的 默认 处 理 行为 ， 或 者 为 信号 设置 一 个 新 的 信号 处 理 程序 。 

进程 中 的 信和 号 是 递送 到 单个 线程 的 。 如 果 一 个 信号 与 硬件 故障 相 
关 ， 那 么 该 信号 一 般 会 被 发 送 到 引起 该 事件 的 线程 中 去 ， 而 其 他 的 信 
号 则 被 发 送 到 任意 一 个 线程 。 

10.12 节 讨 论 了 进程 如 何 使 用 sigprocmask 函数 来 阻止 信号 发 送 。 
然而 ，sigprocmask 的 行为 在 多 线程 的 进程 中 并 没有 定义 ， 线 程 必须 使 


FBpthread sigmask ° 

#include <signal.h> 

int pthread_sigmask(int how, const sigset_t *restrict set, 

sigset_t *restrict oset); 
返回 值 : AA, RE; BM, we RAS 

pthread_sigmask 函数 与 sigprocmask EX Zi 26 AN 4H [E] , A ot 
pthread_sigmask 工作 在 线程 中 ， 而 且 失 败 时 返回 错误 码 ， 不 再 像 
sigprocmask 中 那样 设置 errmno 并 返回 -1。set 参 数 包含 线程 用 于 修改 信和 号 
屏蔽 字 的 信号 集 。how 参 数 可 以 取 下 列 3 个 值 之 一 : SIG_BLOCK， 把 信 
号 集 添加 到 线程 信号 屏蔽 字 中 ，SIG_SETMASK， 用 信号 集 替 换 线程 的 
(aS BRIS; SIG_UNBLOCK， 从 线程 信号 屏蔽 字 中 移 除 信 号 集 。 如 
果 oset 参 数 不 为 空 ， 线 程 之 前 的 信号 屏蔽 字 就 存储 在 它 指 癌 的 sigset_t 结 
构 中 。 线 程 可 以 通过 把 set 参 数 设 置 为 NULL， 并 把 oset 参 数 设置 为 
sigset_t 结 构 的 地 址 ， 来 获取 当前 的 信号 屏蔽 字 。 这 种 情况 中 的 how 参 数 
会 被 忽略 。 

线程 可 以 通过 调用 sigwait 等 待 一 个 或 多 个 信号 的 出 现 。 


#include <signal.h> 


int sigwait(const sigset_t *restrict set, int *restrict signop); 
REE: ERJ, RElo; 否则 ， 返 回 错误 编号 

set 参 数 指定 了 线程 等 待 的 信号 集 。 返 回 时 ，signop 指 同 的 整数 将 包 
舍 发 送信 号 的 数量 。 

如 果 信 号 集中 的 某 个 信号 在 sigwait 调 用 的 时 候 处 于 挂 起 状态 ， 那 
么 sigwait 将 无 阻塞 地 返回 。 在 返回 之 前 ，sigwait 将 从 进程 中 移 除 那些 
处 于 挂 起 等 待 状态 的 信号 。 如 有 果 上 有 具体 实 现 文 持 排 队 信号 ， 并 且 信 和 号 的 
多 个 实例 被 挂 起 ， 那 么 sigwait 将 会 移 除 该 信号 的 一 个 实例 ， 其 他 的 实 
例 还 要 继续 排队 。 


为 了 避免 错误 行为 发 生 ， 线 程 在 调用 sigwait 之 前 ， 必 须 阻 塞 那些 
它 正 在 等 每 的 信号 。sigwait 芳 数 会 原子 地 取消 信号 集 的 阻 窗 状态 ， 直 
SIUE TH fm POI ° EREZA, sigwait EE PX E TX REB fa or DE ik 
F ° WA SE sigwait 被 调用 的 时 候 没 有 被 阻塞 ， 那 么 在 线程 完成 对 
sigwait 的 调用 之 前 会 出 现 一 个 时 间 窗 ， 在 这 个 时 间 窗 中 ， 信 号 就 可 以 
被 发 送 给 线程 。 

使 用 sigwait 的 好 处 在 于 它 可 以 简化 信号 处 理 ， 人 允许 把 异步 产生 的 
言 写 用 同步 的 方式 处 理 。 为 了 防止 信号 中 断 线程 ， 可 以 把 信号 加 到 每 
个 线程 的 信号 屏蔽 字 中 。 人 然后 可 以 安排 专用 线程 处 理 信号 。 这 些 专用 
线程 可 以 进行 画 数 调用 ， 不 需要 担心 在 信号 处 理 程序 中 调用 哪些 函数 
是 安全 的 ， 因 为 这 些 函 数 调用 来 目 正 常 的 线程 上 下 文 ， 而 非 会 中 断 线 
程 正常 执行 的 传统 信号 处 理 程序 。 

如 果 多 个 线程 在 sigwait 的 调用 中 因 等 每 同一 个 信和 号 而 阻塞 ， 那 么 
Tela SIAR, BLA SEE AT DUM sigwait 中 返回 。 如 来 一 个 
言 号 被 捕获 (例如 进程 通过 使 用 sigaction 建 立 了 一 个 信号 处 理 程序 ) ， 
而 且 一 个 线程 正在 sigwait 调 用 中 等 竺 同一 信号 ， 那 么 这 时 将 由 操作 系 
统 实 现 来 决定 以 何 种 方式 递送 信号 。 操 作 系 统 实现 可 以 让 sigwait ik 
回 ， 也 可 以 激活 信号 处 理 程序 ， 但 这 两 种 情况 不 会 同时 发 生 。 

要 把 信号 发 送 给 进程 ， 可 以 调用 kill (7010.95) 。 要 把 信号 发 送 
给 线程 ， 可 以 调用 pthread_kill 。 


#include <signal.h> 


int pthread_kill(pthread_t thread, int signo); 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 
可 以 传 一 个 0 值 的 signo 来 检查 线程 是 否 存 在 。 如 果 信 号 的 默认 处 理 
动作 是 终止 该 进程 ， 那 么 把 信号 传递 给 某 个 线程 仍然 会 杀 死 整个 进 
程 。 


ES, HEN A CHR A, FARRAR CHR E AS 
钟 。 所 以 ， 进 程 中 的 多 个 线程 不 可 能 互 不 干扰 (或 互 不 合作 ) 地 使 用 
PENA (这 是 习题 12.6 的 内 容 ) 。 

实例 

回忆 图 10-23 所 示 的 程序 ， 我 们 等 待 信号 处 理 程序 设置 标志 表明 主 
程序 应 该 退出 。 唯 一 可 运行 的 控制 线程 就 是 主线 程 和 信号 处 理 程序 ， 
所 以 阻塞 信号 足以 避免 错失 标志 修改 。 在 线程 中 ， 我 们 需要 使 用 互 斥 
量 来 保护 标志 ， 如 图 12-16 中 的 程序 所 示 。 


#include "apue.h" 
#include <pthread.h> 


int quitflag; /* set nonzero by thread */ 
sigset_t mask; 


pthread_mutex_t lock = PTHREAD MUTEX_INITIALIZER; 
pthread_cond_t waitloc = PTHREAD_COND_INITIALIZER; 


void * 
thr_fn(void *arg) 
{ 


int err, signo; 


for (;;) { 
err = sigwait(&mask, &signo); 
if (err !- 0) 
err exit(err, "sigwait failed"); 


switch (signo) { 

case SIGINT: 
printf("Nninterrupt An"); 
break; 


case SIGQUIT: 
pthread mutex lock(&lock); 
quitflag = 1; 
pthread mutex unlock(&lock); 
pthread cond signal(&waitloc); 
return(0); 


default: 
printf("unexpected signal %d\n", signo); 
exit (1); 


int 
main (void) 


{ 


int err; 
sigset_t oldmask; 
pthread_t tid; 


sigemptyset(&mask); 

Sigaddset(&mask, SIGINT); 

Sigaddset(&mask, SIGQUIT); 

if ((err = pthread sigmask(SIG BLOCK, &mask, &oldmask)) != 0) 
err exit(err, "SIG BLOCK error"); 


err = pthread create(&tid, NULL, thr fn, 0); 
if (err != 0) 
err exit(err, "can't create thread"); 


pthread mutex lock(&lock); 

while (quitflag -- 0) 
pthread cond wait(&waitloc, &lock); 

pthread mutex unlock(&lock); 


/* SIGQUIT has been caught and is now blocked; do whatever */ 
quitflag - 0; 


/* reset signal mask which unblocks SIGQUIT */ 

if (sigprocmask(SIG SETMASK, &oldmask, NULL) « 0) 
err Sys("SIG SETMASK error"); 

exit(0); 


图 12-16 同步 信号 处 理 


我 们 不 用 依赖 信号 处 理 程序 中 断 主 控 线 程 ， 有 专门 的 独立 控制 线 
程 进行 信号 处 理 。 在 互 不 量 的 保护 下 改动 quitflag 的 值 ， 这 样 主 控 线程 
\ 会 在 调用 pthread_cond_signal 时 错失 唤醒 调用 。 在 主 探 线 程 中 使 用 相 
同 的 互 斥 量 来 检查 标志 的 值 ， 并 且 原 子 地 释放 互 斥 量 ， 等 竺 条件 的 发 
HE o 

注意 ， 在 主线 程 开 始 时 阻塞 SIGINT 和 SIGQUIT 。 当 创建 线程 进 
行 信号 处 理 时 ， 新 建 线程 继承 了 现 有 的 信和 号 屏蔽 字 。 因 为 sigwait 会 解 
除 信 号 的 阻塞 状态 ， 所 有 只 有 一 个 线程 可 以 用 于 信号 的 接收 。 这 可 以 
使 我 们 对 主线 程 进行 编码 时 不 必 担 心 来 自 这 些 信 号 的 中 断 。 

运行 这 个 程序 可 以 得 到 与 图 10-23 类 似 的 输出 结 采 : 


$ ./a.out 

A? 输入 中 断 字 符 

A? 再 次 输入 中 断 字符 
interrupt 

interrupt 

A? 再 次 输入 中 断 字符 
N$ 现在 用 退出 符 终 止 
interrupt 


12.9 线程 和 fork 


当 线 程 调用 fork 时 ， 束 为 子 进程 创建 了 整个 进程 地 址 空间 的 副本 。 
回忆 8.3 节 中 讨论 的 写 时 复制 ， 子 进程 与 父 进 程 是 完全 不 同 的 进程 ， 只 
要 两 者 都 没有 对 内 存 内 容 做 出 改动 ， 父 进程 和 子 进程 之 间 还 可 以 共享 
内 存 页 的 副本 。 


子 进程 通过 继承 整个 地 址 空间 的 副本 ， 还 从 父 进 程 那儿 继承 了 每 
个 互 不 量 、 读 写 锁 和 条 件 变 量 的 状态 。 如 果 父 进程 包含 一 个 以 上 的 线 
程 ， 子 进程 在 fork 返 回 以 后 ， 如 采 紧 接着 不 是 马上 调用 exec 的 话 ， 残 需 
要 清理 锁 状 态 。 

在 子 进程 内 部 ， 只 存在 一 个 线程 ， 它 是 由 父 进程 中 调用 fork 的 线程 
的 副本 构成 的 。 如 果 父 进程 中 的 线程 占有 锁 ， 子 进程 将 同样 占有 这 些 
锁 。 问 题 是 子 进 程 并 不 包含 占有 锁 的 线程 的 副本 ， 所 以 子 进程 没有 办 
法 知道 它 占有 了 哪些 锁 、 需 要 释放 哪些 锁 。 

如 果子 进程 从 fork 返 回 以 后 马上 调用 其 中 一 个 exec 函 数 ， 允 可 以 避 
免 这 样 的 问题 。 这 种 情况 下 ， 旧 的 地 址 空间 束 补 丢弃， 所 以 锁 的 状态 
无 关 紧 要 。 但 如 果子 进程 需要 继续 做 处 理工 作 的 话 ， 这 种 策略 就 行 不 
通 ， 还 需要 使 用 其 他 的 策略 。 

在 多 线程 的 进程 中 ， 为 了 避免 不 一 致 状态 的 问题 ，POSIX.1 声 明 ， 
在 forkk 返 回 和 子 进 程 调用 其 中 一 个 exec 函 数 之 间 ， 子 进程 只 能 调用 异步 
信号 安全 的 函数 。 这 就 限制 了 在 调用 exec 之 前 子 进程 能 做 什么 ， 但 不 涉 
及 子 进 程 中 锁 状 态 的 问题 。 

要 清除 锁 状 态 ， 可 以 通过 调用 pthread_atfork 函 数 建立 fork 处 理 程 
序 o 

#include <pthread.h> 


int pthread_atfork(void (*prepare)(void), void (*parent)(void), 
void (*child)(void)); 

返回 值 : Aa, RIO; 否则 ， 返 回 错误 编号 
用 pthread_atfork 函 数 最 多 可 以 安 闭 3 个 帮助 清理 锁 的 函数 。prepare 
fork 处 理 程序 由 父 进程 在 fork 创 建 子 进 程 前 调用 。 这 个 fork 处 理 程 序 的 
任务 是 获取 父 进程 定义 的 所 有 锁 。parent fork 处 理 程 序 是 在 fork 创建 子 
进程 以 后 、 返 回 之 前 在 父 进 程 上 下 文中 调用 的 。 这 个 fork 处 理 程序 的 任 
务 是 对 prepare fork 处 理 程 序 获 取 的 所 有 锁 进 行 解 锁 。child fork 处 理 程序 


在 fork 返 回 之 前 在 子 进程 上 下 文中 调用 。 与 parent fork 处 理 程序 一 样 ， 
child fork 处 理 程 序 也 必须 释放 prepare fork 处 理 程序 获取 的 所 有 锁 。 
注意 ， 不 会 出 现 加 锁 一 次 解锁 两 次 的 情况 ， 虽 然 看 起 来 也 许 会 出 
现 。 子 进程 地 址 空间 在 创建 时 就 得 到 了 父 进 程 定义 的 所 有 锁 的 副本 。 
因为 prepare fork 处 理 程序 获取 了 所 有 的 锁 ， 父 进程 中 的 内 存 和 子 进 程 
中 的 内 存 内 容 在 开始 的 时 候 是 相同 的 。 当 父 进程 和 子 进 程 对 它们 锁 的 
副本 进程 解锁 的 时 候 ， 新 的 内 存 是 分 配给 子 进程 的 ， 父 进程 的 内 存 内 
容 是 复制 到 子 进程 的 内 存 中 ( 写 时 复制 ) ， 所 以 我 们 就 会 陷入 这 样 的 
假象 ， 看 起 来 父 进程 对 它 所 有 的 锁 的 副本 进行 了 加 锁 ， 子 进程 对 它 所 
有 的 锁 的 副本 进行 了 加 锁 。 父 进程 和 子 进 程 对 在 不 同 内 存单 元 的 重复 
的 锁 都 进行 了 解锁 操作 ， 就 好 像 出 现 了 下 列 事件 序列 。 
(1) 父 进程 获取 所 有 的 锁 。 
(2) 子 进 程 获取 所 有 的 锁 。 
(3) 父 进程 释放 它 的 锁 。 
(4) 子 进 程 释放 它 的 锁 。 
可 以 多 次 调用 pthread_atfork 范 数 从 而 设置 多 套 fork 处 理 程序 。 如 果 
不 需要 使 用 其 中 某 个 处 理 程序 ， 可 以 给 特定 的 处 理 程序 参数 传 入 空 指 
针 ， 它 就 不 会 起 任何 作用 了 。 使 用 多 个 forkk 处 理 程 序 时 ， 人 处 理 程序 的 调 
用 顺序 并 不 相同 。parent 和 child fork 处 理 程序 是 以 它们 注册 时 的 顺序 进 
行 调用 的 ， 而 prepare fork 处 理 程序 的 调用 顺序 与 它们 注册 时 的 顺序 相 
反 。 这 样 可 以 允许 多 个 模块 注册 它们 自己 的 fork 处 理 程序 ， 而 且 可 以 保 
持 锁 的 层次 。 
例如 ， 假 设 模块 A 调 用 模块 B 中 的 函数 ， 而 且 每 个 模块 有 目 己 的 
套 锁 。 如 有 果 锁 的 层次 是 A 在 B 之 前 ， 模 块 B 必 须 在 模块 A 之 前 设置 它 的 
fork 处 理 程序 。 当 父 进程 调用 fork 时 ， 束 会 执行 以 下 的 步骤 ， 假 设 子 进 
程 在 父 进程 之 前 运行 : 
(1) 调用 模块 A 的 prepare fork 处 理 程序 获取 模块 A 的 所 有 锁 。 


(2) 调用 模块 B 的 prepare fork 处 理 程序 获取 模块 B 的 所 有 锁 。 

(3) 创建 子 进程 。 

(4) 调用 模块 B 中 的 child fork 处 理 程序 释放 子 进程 中 模块 B 的 所 有 
锁 。 

(5) 调用 模块 A 中 的 child fork 处 理 程序 释放 子 进程 中 模块 A 的 所 有 
锁 。 


(6) fork 函 数 返回 到 子 进 程 。 
(7) 调用 模块 B 中 的 parent fork 处 理 程序 释放 父 进 程 中 模块 B 的 所 
AH e 
(8) 调用 模块 A 中 的 parent fork 处 理 程序 来 释放 父 进程 中 模块 A 的 
FU 8 ° 
(9) forkK ŽOK [n] BI A^ SERE 。 
如 有 果 fork 处 理 程序 是 用 来 清理 锁 状 态 的 ， 那 么 又 由 谁 来 负责 清理 条 
件 变量 的 状态 呢 ? 在 有 些 操作 系统 的 实现 中 ， 条 件 变量 可 能 并 不 需要 
做 任何 清理 。 但 是 有 些 操作 系统 实现 把 锁 作 为 条 件 变 量 实现 的 一 部 
分 ， 这 种 情况 下 的 条 件 变 量 就 需要 清理 。 问 题 是 目前 不 存在 允许 清理 
锁 状 态 的 接口 。 如 采 锁 是 租 入 到 条 件 变量 的 数据 结构 中 的 ， 那 么 在 调 
用 fork 之 后 丈 不 能 使 用 条 件 变 量 ， 因 为 还 没有 可 移植 的 方法 对 锁 进 行 状 
态 清 理 。 另 外 ， 如 果 操 作 系 统 的 实现 是 使 用 全 局 锁 保 护 进 程 中 所 有 的 
条 件 变 量 数 据 结构 ， 那 么 操作 系统 实现 本 里 可 以 在 forkk 库 例 程 中 做 清理 
锁 的 工作 ， 但 是 应 用 程序 不 应 该 依赖 操作 系统 实现 中 类 似 这 样 的 细 
HH o 
实例 
图 12-17 中 的 程序 描述 了 如 何 使 用 pthread_atfork 和 fork 处 理 程序 。 


#include "apue.h" 
#include «pthread.h» 


pthread mutex t lockl PTHREAD MUTEX INITIALIZER; 


PTHREAD MUTEX INITIALIZER; 


pthread mutex t lock2 


void 


prepare (void) 


( 


void 


int err; 


printf("preparing locks...\n"); 


if ((err = pthread mutex lock(&lock1)) != 0) 
err cont(err, "can't lock lockl in prepare handler"); 
if ((err = pthread mutex lock(&lock2)) != 0) 


err cont(err, "can't lock lock2 in prepare handler"); 


parent (void) 


{ 


int err; 


printf("parent unlocking locks...\n"); 


if ((err = pthread mutex unlock(&lock1)) != 0) 
err cont(err, "can't unlock lockl in parent handler"); 
if ((err = pthread mutex unlock(&lock2)) != 0) 


err cont(err, "can't unlock lock2 in parent handler"); 


void 
child(void) 


( 


int err; 


printf("child unlocking locks...\n"); 


if ((err = pthread mutex unlock(&lock1)) != 0) 
err cont(err, "can't unlock lockl in child handler"); 
if ((err = pthread mutex unlock(&lock2)) !- 0) 


err cont(err, "can't unlock lock2 in child handler"); 


void * 
thr fn(void *arg) 


( 


int 


printf ("thread started...\n"); 
pause (); 
return (0); 


main (void) 


{ 


int err; 

pid t pid; 

pthread t tid; 

if ((err = pthread atfork(prepare, parent, child)) !- 0) 


err exit(err, "can't install fork handlers"); 
if ((err = pthread create(&tid, NULL, thr fn, 0)) != 0) 


err exit(err, "can't create thread"); 


sleep (2); 
printf("parent about to fork...\n"); 


if ((pid = fork()) « 0) 
err quit ("fork failed"); 
else if (pid == 0) /* child */ 


printf("child returned from fork\n"); 
else /* parent */ 

printf ("parent returned from fork\n"); 
exit (0); 


图 12-17 pthread, atfork Sz 4l 


图 12-17 中 定义 了 两 个 互 斥 量 ，lock1 和 1lock2 prepare fork 处 理 程 序 
获取 这 两 把 锁 ，child fork 处 理 程 序 在 子 进程 上 下 文中 释放 它们 ，parent 
fork 处 理 程 序 在 父 进 程 上 下 文中 释放 它们 。 

运行 该 程序 ， 得 到 如 下 输出 : 

$ ./a.out 

thread started... 


parent about to fork... 

preparing locks... 

child unlocking locks... 

child returned from fork 

parent unlocking locks... 

parent returned from fork 

可 以 看 到 ，prepare fork 处 理 程序 在 调用 fork 以 后 运行 ，child fork 处 
理 程序 在 fork 调 用 返回 到 子 进程 之 前 运行 ，parent fork 处 理 程序 在 fork 调 
用 返回 给 父 进程 之 前 运行 。 

虽然 pthread_atfork 机 制 的 意图 是 使 fork 之 后 的 锁 状 态 保持 一 致 ， 但 
它 还 是 存在 一 些 不 足 之 处 ， 只 能 在 有 限 情 况 下 可 用 。 

"没有 很 好 的 办 法 对 较 复杂 的 同步 对 象 《如 条 件 变 量 或 者 屏障 ) 进 
行 状 态 的 重新 初始 化 。 


某 些 错误 检查 的 互 斥 量 实现 在 child fork 处 理 程 序 试图 对 被 父 进程 
加 锁 的 互 不 量 进行 解锁 时 会 产生 错误 。 

“递归 互 不 量 不 能 在 child fork 处 理 程序 中 清理 ， 因 为 没有 办 法 确定 
该 互 斥 量 被 加 锁 的 次 数 。 

“如 有 果子 进程 只 允许 调用 异步 信号 安全 的 函数 ，child fork 处 理 程序 
区 不 可 能 清理 同步 对 象 ， 因 为 用 于 操作 清理 的 所 有 函数 都 不 是 异步 信 
号 安全 的 。 实 际 的 问题 是 同步 对 象 在 某 个 线程 调用 fork 时 可 能 处 于 中 间 
状态 ， 除 非 同步 对 象 处 于 一 致 状态 ， 否 则 无 法 被 清理 。 

“如果 应 用 程序 在 信号 处 理 程序 中 调用 了 fork (这 是 合法 的 ， 因 为 
fork 本 身 是 异步 信号 安全 的 ) ，pthread_atfork 注 册 的 fork 处 理 程序 只 能 
调用 异步 信号 安全 的 画 数 ， 否 则 结果 将 是 未 定义 的 。 


12.10 线程 和 LO 


3.11 市 介绍 了 pread 和 pwrite 范 数 。 这 些 画 数 在 多 线程 环境 下 是 非常 
有 用 的 ， 因 为 进程 中 的 所 有 线程 共享 相同 的 文件 描述 符 。 
考 虚 两 个 线程 ， 在 同一 时 间 对 同一 个 文件 描述 符 进 行 读 写 控 作 。 


线程 A 线程 B 
lseek(fd, 300, SEEK. SET); Iseek(fd, 700, 
SEEK, SET); 
read(fd, buf1, 100); read(fd, buf2, 100); 


如 果 线 程 A 执 行 lseek 然 后 线程 B 在 线程 A 调用 read 之 前 调用 lseek， 
那么 两 个 线程 最 终 会 恋 取 同一 条 记录 。 很 显然 这 不 是 我 们 名 望 的 。 
为 了 解决 这 个 问题 ， 可 以 使 用 pread， 使 偏 移 量 的 设 定 和 数据 的 读 
取 成 为 一 个 原子 操作 。 
线程 A 线程 B 


pread(fd, buf1, 100, 300); pread(fd, buf2, 100, 700); 

使 用 pread 可 以 确保 线程 A 读 取 偏 移 量 为 300 的 记录 ， 而 线程 B 读 取 
偏 移 量 为 700 的 记录 。 可 以 使 用 pwrite 来 解决 并 发 线程 对 同一 文件 进行 
写 操 作 的 问题 。 


12.11 小 结 


在 UNIX 系 统 中 ， 线 程 提 供 了 分 解 并 发 任务 的 为 一 种 模型 。 线 程 促 
进 了 独立 控制 线程 之 间 的 共享 但 也 出 现 了 它 特有 的 同步 问题 。 本 章 
中 ,我们 了 解 了 如 何 调整 线程 和 它们 的 同步 原 语 ， 讨 论 了 线程 的 可 重 
入 性 ， 还 学 习 了 线程 如 何 与 其 他 面向 进程 的 系统 调用 进行 交互 。 


习题 


12.1 在 Linux 系 统 中 运行 图 12-17 中 的 程序 ， 但 把 输出 结果 重 定向 到 
一 个 文件 中 ， 并 解释 结 

12.2 实现 putenv_r， 即 putenv 的 可 重 入 版 本 。 确 保 你 的 实现 既是 
线程 安全 的 ， 也 是 异步 信号 安全 有 的。 

12.3 是 否 可 以 通过 在 getenv 函 数 开 始 的 时 候 阻 赛 信 号 ， 并 在 getenv 
璇 数 返 回 之 前 恢复 原来 的 信号 屏蔽 字 这 种 方法 ， 让 图 12-13 中 的 getenv 
函数 变 成 异步 信号 安全 的 ? 解释 其 原因 。 

12.4 写 一 个 程序 练习 图 12-13 中 的 getenv 版 本 ， 在 FreeBSD 上 编译 并 
运行 程序 ， 会 出 现 什么 结果 ? 解释 其 原因 。 

12.5 假设 可 以 在 一 个 程序 中 创建 多 个 线程 执行 不 同 的 任务 ， 为 什 
么 还 是 有 可 能 会 需要 用 fork? 解释 其 原因 。 


12.6 重新 实现 图 10-29 中 的 程序 ， 在 不 使 用 nanosleep 或 
clock_nanosleep 的 情况 下 使 它 成 为 线程 安全 的 。 

12.7 调用 fork 以 后 ， 和 是 否 可 以 通过 首先 用 pthread_cond_destroy 销 毁 
条 件 变量 ， 然 后 用 pthread_cond_init 初始 化 条 件 变 量 这 种 方法 安全 地 在 
子 进程 中 对 条 件 变 量 进行 重新 初始 化 ? 

12.8 图 12-8 中 的 timeout 函 数 可 以 大 大 简化 ， 解 释 其 原因 。 


BE 守护 进程 


13.1 引言 


守护 进程 (daemon) 是 生存 期 长 的 一 种 进程 。 它 们 常常 在 系统 引 
导 狼 入 时 启动 ， 仪 在 系统 天 闭 时 才 终 止 。 因 为 它们 没有 控制 终端 ， 所 
以 说 它们 是 在 后 台 运 行 的 。UNIX 系 统 有 很 多 守护 进程 ， 它 们 执行 日 常 
事务 活动 。 

本 章 将 说 明 守 护 进程 结构 ， 以 及 如 何 编写 守护 进程 程序 。 因 为 守 
护 进 程 没 有 控制 终端 ， 我 们 需要 了 解 在 出 现 问题 时 ， 和 守护 进程 如 何 报 
告 出 错 情 况 。 

有 天 守护 进程 这 一 术语 被 应 用 于 计算 机 系统 的 历史 背景 ， 详 见 
Raymond[1996] ° 


13.2 FPR 


证 我 们 先 来 看 一 些 常用 的 系统 守护 进程 ， 以 及 它们 是 怎样 和 第 9 章 
中 叙述 的 进程 组 、 控 制 终端 和 会 话 这 三 个 概念 相关 联 的 。ps(T) 命 令 打 
印 系统 中 各 个 进程 的 状 在。 该 命令 有 多 个 选项 ， 有 关 细 万 请 参考 系统 
手册 。 为 了 解 本 节 讨 论 中 所 需 的 信息 ， 我 们 在 基于 BSD 的 系统 下 执 
To 


ps -axj 


选项 -a 显示 由 其 他 用 户 所 拥有 的 进程 的 状态 ，-x 显 示 没 有 控制 终端 
的 进程 状态 ，j 显 示 与 作业 有 关 的 信息 : 会 话 ID、 进 程 组 ID、 控 制 终端 
以 及 终端 进程 组 ID。 在 基于 System V 的 系统 中 ， 与 此 相 类 似 的 命令 是 ps 
-efj (为 了 提高 安全 性 ， 某 些 UNIX 系 统 不 允许 用 户 使 用 ps 命令 查看 不 属 


于 自己 的 进程 ) 
UID 
root 
root 
root 
root 
root 
root 
root 
root 
root 
root 
root 
root 
root 
root 
root 
root 
root 
daemon 
root 


root 


e ps 的 输出 大 致 是 : 
PID PPID PGID 
1 0 1 
2 0 0 
3 2 0 
6 2 0 
7 2 0 
21 2 0 
22 2 0 
26 2 0 
27 2 0 
29 2 0 
35 2 0 
49 2 0 
250 2 0 
26464 1 26464 
14596 2 0 
13047 2 0 
8196 1 8196 
1068 1 1068 
1067 1 1067 
1037 1 1037 


SID 


S de» ION EN UE WES UE cues dues xev. i 


TTY COMD 
? Jsbin/init 
? [kthreadd] 
? [ksoftirqd/0] 
? [migration/0] 
? [watchdog/0] 
? [cpuset] 
? [khelper] 
? [sync supers] 
? ([bdi-default] 
? [kblockd] 
? [kswapd0] 
? [scsi eh 0] 
? = [jbd2/sda5-8] 
? rpcbind -w 
? [flush-8:0] 
? [kworker/1:0] 
? /usr/sbin/sshd -D 
? atd 
? cron 


? /usr/sbin/inetd 


root 906 1 906 906 ? /usr/sbin/cupsd - 


F 

syslog 847 1 843 843 ? rsyslogd -c5 

root 257 2 0 0 ? [ext4-dio-unwrit] 

statd 28490 1 28490 28490 ? rpc.statd -L 

root 28561 1 28561 28561 ? rpc.idmapd 

root 28554 2 0 0 ? ([nfsiod] 

root 28553 2 0 0 ? [rpciod] 

root 28775 1 28775 28775 ? 
/usr/sbin/rpc.mountd --manage-gids 

root 28764 2 0 0 ? [nfsd] 

root 28761 2 0 0 ? [lockd] 


其 中 ， 已 移 去 了 一 些 我 们 不 感 兴趣 的 列 ， 如 累计 CPU 时 间 。 按 照 
顺序 ， 各 列 标题 的 意义 分 别 是 用 户 ID、 进 程 ID、 父 进程 ID、 进 程 组 
ID、 会 话 ID、 终 端 名 称 以 及 命令 字符 串 。 

此 ps 命令 在 支持 会 话 包 的 系统 (Linux 3.2.0) 上 运行 ，9.5 节 的 
setsid 函 数 中 曾 提 及 会 话 ID 。 简 单 地 说 ， 它 就 是 会 话 首 进程 的 进程 ID。 
但 是 ， 一 些 基 于 BSD 的 系统 ， 如 Mac OS X 10.6.8， 将 打印 与 本 进程 所 
属 进程 组 对 应 的 session 结 构 的 地 址 ( 见 9.11 节 ) ， 而 非 会 话 ID 的 地 址 。 

系统 进程 依赖 于 操作 系统 实现 。 父 进程 ID 为 0 的 各 进程 通常 是 内 
核 进程 ， 它 们 作为 系统 引导 装 入 过 程 的 一 部 分 而 启动 。 (init 是 个 例 
外 ， 它 是 一 个 由 内 核 在 引导 装 入 时 启动 的 用 户 层次 的 命令 。) 内 核 进 
程 是 特殊 的 ， 通 常 存在 于 系统 的 整个 生命 期 中 。 它 们 以 超级 用 户 特 权 
运行 ， 无 控制 终端 ， 无 命令 行 。 的 服务 。rsyslogd 守 护 进 程 可 以 被 由 管 
理 员 启用 的 将 系统 消息 记 入 日 志 的 任何 程序 使 用 。 可 以 在 一 台 

rpcbind 守 护 进程 提供 将 远程 过 程 调 用 (Remote Procedure Call , 
RPC) 程序 号 映射 为 网 络 端口 号 


在 ps 的 输出 实例 中 ， 内 核 守护 进程 的 名 字 出 现在 方 括号 中 。 该 版 
本 的 Linux 使 用 一 个 名 为 kthreadd 的 特殊 内 核 进程 来 创建 其 他 内 核 进 
程 ， 所 以 kthreadd 表现 为 其 他 内 核 进程 的 父 进程 。 对 于 需要 在 进程 上 
下 文 执行 工作 但 却 不 被 用 户 层 进程 上 下 文 调用 的 每 一 个 内 核 组 件 ， 通 
第 有 它 目 己 的 内 核 守 护 进程 。 例 如 ， 在 Linux 中 : 

。kswapd 守 护 进 程 也 称 为 内 存 换 页 守护 进程 。 它 文 持 虚 拟 内 存 子 系 
统 在 经 过 一 段 时 间 后 将 脏 页 面 慢 慢 地 写 回 磁盘 来 回收 这 些 页 面 。 

* flush 守 护 进 程 在 可 用 内 存 达 到 设置 的 最 小 病 值 时 将 脏 页 面 冲 洗 至 
人 磁盘。 它 也 定期 地 将 脏 页 面 冲 洗 回 磅 盘 来 减少 在 系统 出 现 故障 时 发 生 
的 数据 丢失 。 多 个 冲洗 守护 进程 可 以 同时 存在 ， 每 个 写 回 的 设备 都 有 
一 个 冲洗 守护 进程 。 输 出 实例 中 显示 出 一 个 名 为 flush-8:0 的 冲洗 守护 进 
程 。 从 名 字 中 可 以 看 出 ， 写 回 设备 是 通过 主 设备 号 (8) 和 副 设备 号 

(0) 来 识别 的 。 

“sync_supers 守 护 进 程 定期 将 文件 系统 元 数据 冲洗 至 磁盘。 

jbd 守 护 进 程 帮助 实现 了 ext4 文 件 系统 中 的 日 志 功 能 。 

进程 1 通常 是 init (MacOS X 中 是 launchd) ，8.2 节 对 此 做 过 说 明 。 
它 是 一 个 系统 守护 进程 ， 除 了 其 他 工作 外 ， 主 要 人 负责 启动 各 运行 层次 
特定 的 系统 服务 。 这 些 服 务 通常 是 在 它们 自己 拥有 的 守护 进程 的 帮助 
下 实现 的 。 实 际 的 控制 人 台 上 打印 这 些 消 妃 ， 也 可 将 它们 写 到 一 个 文件 
中 。 (13.4 节 将 对 syslog 设 施 进行 说 明 。) 

9.3 市 已 谈 到 inetd 守 护 进 程 。 它 侦 听 系统 网 络 接口 ， 以 便 取得 来 日 
网 络 的 对 各 种 网 络 服务 进程 的 请 求 。nfsd ^ nfsiod ^ lockd ^ rpciod ^ 
rpc.idmapd ^ rpc.statd 和 rpc.mountd 守 护 进 程 提供 对 网 络 文 件 系 统 

(Network File System, NFS) 的 支持 。 注 意 ， 前 4 个 是 内 核 守 护 进程 ， 
后 3 个 是 用 户 级 守护 进程 。 

cron 守 护 进 程 在 定期 安排 的 日 斯 和 时 间 执 行 命令 。 许 多 系统 管理 任 

务 是 通过 cron 每 隔 一 段 固 定 的 时 间 就 运行 相关 程序 而 得 以 实现 的 。atd 


守护 进程 与 cron 类 似 ， 它 允许 用 户 在 指定 的 时 间 执 行 任务 ， 但 是 每 个 任 
务 它 只 执行 一 次 ， 而 非 在 定期 安排 的 时 间 反 复 执行 。cupsd 守护 进程 是 
个 打印 假 脱 机 进程 ， 它 处 理 对 系统 提出 的 各 个 打印 请 求 。sshd 守 护 进程 
提供 了 安全 的 远程 登录 和 执行 设施 。 

注意 ， 大 多 数 守护 进程 都 以 超级 用 户 (root) 特权 运行 。 所 有 的 守 
护 进程 都 没有 控制 终 问 ， 其 终端 名 设置 为 问号 。 内 核 守 护 进 程 以 无 控 
制 终 站 方式 局 动 。 用 户 层 守护 进程 缺少 控制 终端 可 能 是 守护 进程 调用 
了 setsid 的 结 采 。 大 多 数 用 户 层 守 护 进程 都 是 进程 组 的 组 长 进程 以 及 会 
话 的 首 进程 ， 而 且 是 这 些 进程 组 和 会 话 中 的 唯一 进程 (rsyslogd 是 一 个 
例外 ) 。 最 后 ， 应 当 引 起 注意 的 是 用 户 层 守护 进程 的 父 进程 是 init 进 
程 。 


13.3 编程 规 见 


在 编写 守护 进程 程序 时 需 遵循 一 些 基 本 规则 ， 以 防止 产生 不 必要 
的 交互 作用 。 下 面 先 说 明 这 些 规则 ， 然 后 给 出 一 个 按照 这 些 规 则 编写 
的 函数 daemonize。 
(1) 首先 要 做 的 是 调用 umask 将 文件 模式 创建 屏蔽 字 设 置 为 一 个 
已 知 值 〈 通 党 是 0) 。 由 继承 得 来 的 文件 模式 创建 屏蔽 字 可 能 会 被 设置 
为 拒绝 某 些 权限 。 如 果 守 护 进 程 要 创建 文件 ， 那 么 它 可 能 要 设置 特定 
的 权限 。 例 如 ， 若 守护 进程 要 创建 组 可 读 、 组 可 写 的 文件 ， 继 承 的 文 
件 模 式 创建 屏蔽 字 可 能 会 屏蔽 上 述 两 种 权限 中 的 一 种 ， 而 使 其 无 法 发 
挥 作 用 。 另 一 方面 ， 如 果 守 护 进程 调用 的 库 函 数 创建 了 文件 ， 那 么 将 
文件 模式 创建 屏蔽 字 设 置 为 一 个 限制 性 更 强 的 值 (如 007) 可 能 会 更 明 
吞 ， 因 为 库 范 数 可 能 不 允许 调用 者 通过 一 个 显 式 的 函数 参数 来 设置 权 
限 。 


(2) 调用 fork， 然 后 使 父 进程 exit。 这 样 做 实现 了 下 面 几 点 。 第 
一 ， 如 采 该 守护 进程 是 作为 一 条 人 简单 的 shell 命 令 司 动 的 ， 那 么 父 进程 
终止 会 让 shell 认 为 这 条 命令 已 经 执行 完毕 。 第 二 ， 虽 然 子 进程 继承 了 
父 进程 的 进程 组 ID， 但 获得 了 一 个 新 的 进程 ID， 这 束 保 证 了 了 于 进程 不 
是 一 个 进程 组 的 组 长 进程 。 这 是 下 面 将 要 进行 的 setsid 调 用 的 先决 条 
ps 


(3) 调用 setsid 创 建 一 个 新 会 话 。 然 后 执行 9.5 节 中 列 出 的 3 个 步 
又 ， 使 调用 进程 : (a) 成 为 新 会 话 的 首 进程 ， (\b) 成 为 一 个 新 进程 
组 的 组 长 进程 ， (0) 没有 控制 终端 。 

在 基于 System V 的 系统 中 ， 有 些 人 建议 在 此 时 再 次 调用 fork， 终 止 
父 进 程 ， 继 续 使 用 子 进 程 中 的 守护 进程 。 这 就 保证 了 该 守护 进程 不 是 
会 话 首 进程 ， 于 是 按照 System V 规 则 〈 见 9.6 节 ) 可 以 防止 它 取 得 控制 
终端 。 为 了 避免 取得 控制 终端 的 另 一 种 方法 是 ， 无 论 何 时 打开 一 个 终 
端 设 备 ， 都 一 定 要 指定 O_NOCTTY ° 

(4) 将 当前 工作 目录 更 改 为 根 目 录 。 从 父 进 程 处 继承 过 来 的 当前 
工作 目录 可 能 在 一 个 挂 载 的 文件 系统 中 。 因 为 守护 进程 通常 在 系统 
引导 之 前 是 一 直 存 在 的 ， 所 以 如 采 和 守护 进程 的 当前 工作 目录 在 一 个 挂 
载 文件 系统 中 ， 那 么 该 文件 系统 就 不 能 被 外 载 。 

或 者 ， 某 些 守 护 进 程 还 可 能 会 把 当前 工作 目录 更 改 到 某 个 指定 位 
置 ， 并 在 此 位 置 进行 它们 的 全 部 工作 。 例 如 ， 行 式 打印 机 假 脱 机 守护 
进程 就 可 能 将 其 工作 目录 更 改 到 它们 的 spool 目 录 上 。 

(5) 关闭 不 再 需要 的 文件 描述 符 。 这 使 守护 进程 不 再 持 有 从 其 父 
进程 继承 来 的 任何 文件 描述 符 〈 父 进程 可 能 是 shell 进程 ， 或 某 个 其 他 
进程 ) 。 可 以 使 用 open max 函数 (JL 2.17 77) 或 getrlimit 函 数 (JL 
7.1177) 来 判定 最 高 文件 描述 符 值 ， 并 关闭 直到 该 值 的 所 有 描述 符 。 

(6) 某 些 守护 进程 打开 /devwnull 使 其 具有 文件 描述 符 0、1 和 2， 这 
样 ， 任 何 一 个 试图 读 标 准 输 入 、 写 标准 输出 或 标准 错误 的 库 例 程 都 不 


会 产生 任何 效 末 。 因 为 守护 进程 并 不 与 终端 设备 相关 联 ， 所 以 其 输出 
无 处 显示 ， 也 无 处 从 交互 式 用 户 那 里 接收 输入 。 即 使 守护 进程 是 从 交 
互 式 会 话 启 动 的 ， 但 古村 护 进 程 是 在 后 台 运行 的 ， 所 以 登录 会 话 的 终 
止 并 不 影响 守护 进程 。 如 有 果 其 他 用 户 在 同一 终端 设备 上 登录 ， 我 们 不 
布 望 在 该 终端 上 见 到 守护 进程 的 输出 ， 用 户 也 不 期 望 他 们 在 终端 上 的 
输入 被 守护 进程 读 取 。 

实例 

图 13-1 所 示 的 函数 可 由 一 个 想 要 初始 化 为 守护 进程 的 程序 调用 。 


#include "apue .hy" 
#include <syslog.h> 
#include <fcntl.h> 
#include <sys/resource.h> 


void 
daemonize(const char *cmd) 


{ 


int i; £00; dily :£d2; 
pid t pid; 
struct rlimit Él; 


struct sigaction sa; 


/* 
* Clear file creation mask. 
274 


umask (0) ; 


/* 
* Get maximum number of file descriptors. 
x 
if (getrlimit(RLIMIT NOFILE, &rl) « 0) 
err quit("$s: can't get file limit", cmd); 


/* 
* Become a session leader to lose controlling TTY. 
Ay 
if ((pid » fork()) « O) 
err quit("*s: can"t fork", cmd); 


else if (pid !- 0) /* parent */ 
exit(0); 
setsid(); 
/* 
* Ensure future opens won't allocate controlling TTYs. 
i À 


sa.sa handler = SIG IGN; 


Sigemptyset(&sa.sa mask); 
sa.sa flags = 0; 
if (sigaction(SIGHUP, &sa, NULL) « 0) 
err quit("$s: can't ignore SIGHUP", cmd); 
if ((pid = fork()) « 0) 
err quit("$s: can't fork", cmd); 
else if (pid != 0) /* parent */ 
exit(0); 


/* 
* Change the current working directory to the root so 
* we won't prevent file systems from being unmounted. 
ui 

if (chdin("/™) «€ 0) 

err quit("$s: can't change directory to /", cmd); 


/* 

* Close all open file descriptors. 
*/ 

if (rl.rlim max -- RLIM INFINITY) 


rl.rlim max = 1024; 
for (i = Of 4. € rl.rliuw max; i++) 
close(i); 


/* 

* Attach file descriptors 0, 1, and 2 to /dev/null. 
Sy 

fd0 = open("/dev/null", O RDWR); 

fdl = dup(0); 

fd2 = dup(0); 

/* 

* Initialize the log file. 

ia 


openlog(cmd, LOG CONS, LOG DAEMON); 
if (fdo I= 0 || fdl !=1 || fd2 != 2) { 
syslog (LOG ERR, "unexpected file descriptors $d $d $d", 
fd0, fal, £d2); 
exit (1); 


d 


图 13-1 19) 48 445— “SSFP 
若 daemonize 函 数 由 main 程 序 调 用 ， 然 后 main 程 序 进 入 休眠 状态 ， 
那么 可 以 用 ps 命令 检查 该 守护 进程 的 状态 : 
$ ./a.out 


上 


$ ps -efj 


UID PID PPID PGID SID TTY CMD 

sar 13800 1 13799 13799 ? _ ./a.out 

$ ps -efj | grep 13799 

sar 13800 1 13799 13799 ?  /a.out 

我 们 也 可 用 ps 命令 验证 ， 没 有 活动 进程 存在 的 ID 是 13799。 这 意味 
着 ， 守 护 进 程 在 一 个 孤儿 进程 组 中 〈 见 9.10 节 ) ， 它 不 是 会 话 首 进 
程 ， 因 此 没有 机 会 被 分 配 到 一 个 控制 终端 。 这 一 结果 是 在 daemonize 函 
数 中 执行 第 二 个 fork 造 成 的 。 可 以 看 出 ， 守 护 进 程 已 经 被 正确 地 初始 化 
T 


13.4 出 错 记录 


守护 进程 存在 的 一 个 问题 是 如 何 处 理 出 错 消息 。 因 为 它 本 就 不 应 
该 有 控制 终端 ， 所 以 不 能 只 是 简单 地 写 到 标准 错误 上 。 我 们 不 希望 所 
有 守护 进程 都 写 到 控制 台 设 备 上 ， 因 为 在 很 多 工作 站 上 控制 台 设 备 都 
运行 着 一 个 窗口 系统 。 我 们 也 不 希望 每 个 守护 进程 将 它 自己 的 出 错 消 
息 写 到 一 个 单独 的 文件 中 。 对 任何 一 个 系统 管理 人 员 而 言 ， 如 果 要 天 
心 哪 一 个 守护 进程 写 到 哪 一 个 记录 文件 中 ， 并 定期 地 检查 这 些 文件 ， 
那么 一 定 会 使 他 感到 头痛 。 所 以 ， 需 要 有 一 个 集中 的 守护 进程 出 错 记 
录 设 施 。 

BSD syslog 设施 是 在 伯克利 开发 的 ， 广 泛 应 用 于 4.2BSD。 从 BSD 
派生 的 很 多 系统 都 支持 syslog。 在 SVR4 之 前 ，System V 中 从 来 没有 
个 集中 的 守护 进程 记录 设施 。 在 Single UNIX Specification 的 XSI 扩 展 中 
48 T syslogER RX ^ 

自 4.2BSD 以 来 ，BSD 的 syslog 设 施 得 到 了 广泛 的 应 用 。 大 多 数 守 护 
进程 都 使 用 这 一 设施 。 图 13-2 显 示 了 syslog 设 施 的 详细 组 织 结构 。 


被 写 入 文件 或 已 
登录 用 户 或 发 送 至 
另 一 个 主机 


syslog 


/dev/log /dev/klog 


| 

| 

| 

| UNIX 因特网 域 数 据 
|o 域 数据 报 套 接 字 报 套 接 字 
| 

| 

| 

| 

| 

| 


内 核 例 程 


TCP/IP 网 络 
图 13-2 BSD 的 syslog 设 施 
有 以 下 3 种 产生 日 志 消 息 的 方法 。 

(1) 内 核 例 程 可 以 调用 log 函数 。 任 何 一 个 用 户 进 程 都 可 以 通过 
打开 (open) 并 读 取 (read) /dev/klog 设 备 来 读 取 这 些 消息 。 因 为 我 们 
无 意 编写 内 核 例 程 ， 所 以 不 再 进一步 说 明 此 函数 。 

(2) 大 多 数 用 户 进 程 “守护 进程 ) 调用 syslog(3) 画 数 来 产生 日 志 
消息 。 我 们 将 在 下 面 说 明 其 调用 序列 。 这 使 消息 被 发 送 至 UNIX 域 数据 
报 套 接 字 /devwlog ° 

(3) 无 论 一 个 用 户 进程 是 在 此 主机 上 ， 还 是 在 通过 TCP/IP 网 络 连 
接 到 此 主机 的 其 他 主机 上 ， 都 可 将 日 志 消 息 发 问 UDP 端 口 514。 注 意 ， 


syslog EK aX MAT EX UDP AER, “ENT Bere EE SB BUSES 
进行 显 式 的 网 络 编程 。 

天 于 UNIX 域 套 接 字 以 及 UDP 套 接 字 的 细 广 ， 请 参阅 Stevens ` 
Fenner 和 Rudoff[2004] ° 

通常，syslogd 守 护 进 程 读 取 所 有 3 种 格式 的 日 志 消 县 。 此 守护 进程 
在 启动 时 读 一 个 配置 文件 ， 其 文件 名 一 般 为 /etc/syslog.conf， 该 文件 决 
定 了 不 同 种 类 的 消 居 应 送 同 何 处 。 例 如 ， 紧 急 消息 可 发 送 至 系统 管理 
员 (ERK) ， 并 在 控制 台 上 打印 ， 而 警告 消息 则 可 记录 到 一 个 文 
件 中 。 

THN syslog WA © 

#include <syslog.h> 


void openlog(const char *ident, int option, int facility); 

void syslog(int priority, const char *format, ...); 

void closelog(void); 

int setlogmask(int maskpri); 

返回 值 : Bl A IS TE EE 

调用 openlog 是 可 选择 的 。 如 果 不 调 用 openlog， 则 在 第 一 次 调用 
syslog 时 ， 目 动 调用 openlog。 调 用 closelog 也 是 可 选择 的 ， 因 为 它 只 是 
关闭 曾 被 用 于 与 syslogd 和 守护 进程 进行 通信 的 描述 符 。 

调用 openlog 使 我 们 可 以 指定 一 个 ident， 以 后 ， 此 ident 将 被 加 至 每 
则 日 志 消 息 中 。ident 一 般 是 程序 的 名 称 《如 cron > inetd) 。option 参 数 
是 指定 各 种 选项 的 位 屏蔽 。 图 13-3 介 绍 了 可 用 的 option (选项 ) 。 若 在 
Single UNIX Specification 的 openlog 定 义 中 包括 了 该 选项 ， 则 在 XSI 列 中 
用 一 个 黑 扣 表示 。 


LOG CONS . 若 日 志 消息 不 能 通过 UNIX 域 数据 报 送 至 syslogd， 则 将 该 消息 写 至 控制 台 
LOG NDELAY " 立即 打开 至 syslogd 守护 进程 的 UNIX 域 数 据 报 套 接 字 ， 不 要 等 到 第 一 条 消息 
已 经 被 记录 时 再 打开 。 通 常 ， 在 记录 第 一 条 消息 之 前 ， 不 打开 该 套 接 字 
LOG_NOWAIT 不 要 等 待 在 将 消息 记 入 日 志 过 程 中 可 能 已 创建 的 子 进程 。 因 为 在 syslog 调用 


wait 时 ， 应 用 程序 可 能 已 获得 了 子 进程 的 状态 ， 这 种 处 理 阻止 了 与 捕捉 SIGCHLD 
信号 的 应 用 程序 之 间 产 生 的 冲突 

LOG ODELAY 。 在 第 一 条 消息 被 记录 之 前 延迟 打开 至 syslogd 守护 进程 的 连接 

LOG PERROR 除 将 日 志 消息 发 送 给 syslogd 以 外 ,还 将 它 写 至 标准 出 错 (在 Solaris. 上 不 可 用 ) 
LOG_PID 记录 每 条 消息 都 要 包含 进程 ID。 此 选项 可 供 对 每 个 不 同 的 请 求 都 fork 一 个 子 进 
程 的 守护 进程 使 用 〈 与 从 不 调用 fork 的 守护 进程 相 比 较 ， 如 syslogd) 


图 13-3 openlog 的 option 参 数 


openlog 的 facility Z 2% (E 36 FX A Ed 13-4 ° JE, Single UNIX 
Specification 只 定义 了 facility 所 有 参数 值 中 的 一 个 子 集 ， 该 子 集 一 般 只 
能 用 在 一 个 给 定 的 平台 上 。 设 置 facility 参 数 的 目的 是 可 以 让 配置 文件 说 
明 ， 来 自 不 同 设施 的 消息 将 以 不 同 的 方式 进行 处 理 。 如 果 不 调 用 
openlog ， 或 者 以 facility 为 0 来 调用 它 ， 那 么 在 调用 syslog 时 ， 可 将 
facility 作 为 priority 参 数 的 一 个 部 分 进行 说 明 。 

JH syslog ^E — T Hi 1H s. e priority 2 facility Mlevel A) 24 
合 ， 它 们 可 选取 的 值 分 别 列 于 facility ( 见 图 13-4) Fllevel ( 见 图 13-5) 
中 。level 值 按 优先 级 从 最 高 到 最 低 依次 排列 。 


LOG AUDIT 
LOG AUTH 


LOG AUTHPRIV 


LOG CONSOLE 
LOG CRON 
LOG DAEMON 
LOG FTP 
LOG KERN 
LOG LOCALO 
LOG LOCAL1 
LOG LOCAL2 
LOG LOCAL3 
LOG LOCAL4 
LOG LOCAL5 
LOG LOCAL6 
LOG LOCAL7 
LOG LPR 
LOG MAIL 
LOG NEWS 
LOG NTP 
LOG SECURITY 
LOG SYSLOG 
LOG USER 
LOG UUCP 


审计 设施 

授权 程序 ，login、su、getty 等 
与 LOG_AUTH 相同 ,但 写 日 志文 件 时 有 具 
有 权限 限制 

消息 写 入 /dev/console 

cron 和 at 

系统 守护 进程 ，inetd、routed 等 
FTP 和 守护 进程 (ftpd) 

内 核 产生 的 消息 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

行 式 打印 机 系统 : lpd. lpc 等 
邮件 系统 

Usenet 网 络 新 闻 系 统 

网 络 时 间 协 议 系统 

安全 子 系统 

syslogd 守护 进程 本 身 

来 自 其 他 用 户 进程 的 消息 (默认 ) 
UUCP 系统 


图 13-4 openlog 的 facility 参 数 


LOG EMERG 紧急 〈 系 统 不 可 使 用 )〈 最 高 优先 级 ) 
LOG ALERT 必须 立即 修复 的 情况 
LOG CRIT 严重 情况 〈 如 硬件 设备 出 错 ) 


LOG_ERR H fe tes OL 

LOG WARNING 警告 情况 

LOG NOTICE 正常 但 重要 的 情况 
LOG INFO 信息 性 消息 

LOG DEBUG 调试 消息 (最 低 优先 级 ) 


图 13-5 syslog 中 的 level ( 按 序 排列 ) 

将 format 参 数 以 及 其 他 所 有 参数 传 至 vsprintf 函 数 以 便 进 行 格式 化 。 
在 format 中 ， 每 个 出 现 的 %m 字 符 都 移 被 代 换 成 邱 errmno 值 对 应 的 出 销 消 
AFITE (strerror) ° 

setlogmask HŽ H Ti EAEN IC ICS » Eel Va AE 
之 前 的 屏蔽 字 。 当 设置 了 记录 优先 级 屏蔽 字 时 ， 各 条 消息 除非 已 在 记 
录 优 先 级 屏蔽 字 中 进行 了 设置 ， 否 则 将 不 被 记录 。 注 意 ， 试 图 将 记录 
优先 级 屏蔽 字 设 置 为 0 并 不 会 有 什么 作用 。 

很 多 系统 也 将 logger(1) 程 序 作为 向 syslog 设 施 发 送 日 志 消 居 的 方 
法 。 虽 然 Single UNIX Specification 没有 定义 任何 可 选 参数 ， 但 某 些 实 
现 允 许 将 该 程序 的 可 选 参数 指定 为 facility、level 和 ident。logger 命 令 是 
专门 为 以 非 交 互 方式 运行 的 需要 产生 日 志 消 息 的 shell 脚 本 设计 的 。 

实例 

在 一 个 (假定 的 ) 行 式 打印 机 假 脱 机 守护 进程 中 ， 可 能 包含 有 下 
面 的 调用 序列 ; 

openlog("Ipd", LOG. PID, LOG LPR); 

syslog(LOG ERR, "open error for 96s: %m", filename); 


第 一 个 调用 将 ident 字 符 串 设置 为 程序 名 ， 指 定 该 进程 ID 要 始终 被 
打印 ， 并 且 将 系统 默认 的 facility 设 定 为 行 式 打印 机 系统 。 对 syslog AY 
调用 指定 一 个 出 错 条 件 和 一 个 消息 字符 时 。 如 奉 不 调用 openlog， 则 第 
二 个 调用 的 形式 可 能 是 : 

syslog(LOG_ERR | LOG LPR, "open error for 96s: %m", filename); 

其 中 ， 将 priority 参 数 指定 为 level 和 facility 的 组 合 。 

除了 syslog， 很 多 平台 还 提供 它 的 一 种 变 体 来 处 理 可 变 参 数列 表 。 

#include <syslog.h> 


#include <stdarg.h> 

void vsyslog(int priority, const char *format, va list arg); 

本 书 说 明 的 所 有 4 种 平台 都 提供 vsyslog ， 但 Single UNIX 
Specification 中 并 不 包括 它 。 注 意 ， 如 果 要 使 它 的 声明 对 应 用 程序 可 
见 ， 可 能 需要 定义 一 个 额外 的 符号 ， 例 如 ， 在 FreeBSD 中 定义 
BSD_VISIBLE 或 在 Linux 中 定义 “USE_BSD ° 

大 多 数 syslog 实 现 将 使 消息 短 时 间 处 于 队列 中 。 如 果 在 此 段 时 间 中 
有 重复 消息 到 达 ， 那 么 syslog 守护 进程 不 会 把 它 写 到 日 志 记 录 中 ， 而 是 
会 打印 输出 一 条 类 似 于 “上 一 条 消息 重复 了 N 次 ”的 消息 。 


13.5 单 实 例 守 护 进 程 


为 了 正音 运作 ， 某 些 守护 进程 会 实现 为 ， 在 任 一 时 刻 只 运行 该 守 
护 进 程 的 一 个 副本 。 例 如 ， 这 种 守护 进程 可 能 需要 排 它 地 访问 一 个 设 
备 。 对 cron 和 守护 进程 而 言 ， 如 果 同 时 有 多 个 实例 运行 ， 那 么 每 个 副本 都 
试图 开始 菏 个 预定 的 操作 ， 于 是 造成 该 操作 的 重复 执行 ， 这 很 可 


如 果 守 护 进 程 需要 访问 一 个 设备 ， 而 该 设备 驱动 程序 有 时 会 阻止 
想 要 多 次 打开 /dev 目录 下 相应 设备 市 扩 的 笑 试 。 这 就 限制 了 在 一 个 时 
刻 只 能 运行 守护 进程 的 一 个 副本 。 但 是 如 果 没 有 这 种 设备 可 供 使 用 ， 
那么 我 们 束 需 要 上 自行 处 理 。 

文件 和 记 杂 锁 机 制 为 一 种 方法 提供 了 基础 ， 该 方法 人 证 一 个 守护 
进程 只 有 一 个 副本 在 运行 。 《文件 和 记录 锁 将 在 14.3 节 中 讨论 。) 如 果 
每 一 个 守护 进程 创建 一 个 有 固定 名 字 的 文件 ， 并 在 该 文件 的 整体 上 加 
一 把 写 锁 ， 那 么 只 允许 创建 一 把 这 样 的 写 锁 。 在 此 之 后 创建 写 锁 的 稚 
试 都 会 失败 ， 这 同 后 续 守 护 进 程 副本 指明 已 有 一 个 副本 正在 运行 。 

文件 和 记录 锁 提 供 了 一 种 方便 的 互 不 机 制 。 如 琳 守 护 进程 在 一 个 
文件 的 整体 上 得 到 一 把 写 锁 ， 那 么 在 该 守护 进程 终止 时 ， 这 把 锁 将 被 
自动 删除 。 这 束 简 化 了 复原 所 需 的 处 理 ， 去 除了 对 以 前 的 守护 进程 实 
例 需要 进行 清理 的 有 关 操 作 。 

实例 

图 13-6 所 示 的 函数 说 明了 如 何 使 用 文件 和 记 杂 饼 来 保证 只 运行 一 个 
守护 进程 的 一 个 副本 。 


#include <unistd.h> 
#include <stdlib.h> 
#include <fcntl.h> 
#include <syslog.h> 
#include <string.h> 


#include <errno.h> 
#include <stdio.h> 
#include <sys/stat.h> 


#define LOCKFILE "/var/run/daemon.pid" 
#define LOCKMODE (S_IRUSR|S_IWUSR|S_IRGRP|S_IROTH) 


extern int lockfile(int); 


int 


already running (void) 


( 


int Eae 
char buf[16]; 


fd = open(LOCKFILE, O RDWR|O CREAT, LOCKMODE) ; 
if (£d) <= 10) f 
syslog(LOG_ERR, "can't open $s: %s", LOCKFILE, strerror(errno)); 
exit(1); 
) 
if (lockfile(fd) « O) ( 
if (errno == EACCES || errno == EAGAIN) { 
close (fd); 
return (1); 
} 
syslog(LOG_ERR, "can't lock $s: $s", LOCKFILE, strerror(errno)); 
exit(1); 
} 
ftruncate(fd, 0); 


sprintf(buf, "tld", (long) getpid()); 
write(fd, buf, strlen(buf)+1); 
return (0); 


图 13-6 保证 只 运行 一 个 守护 进程 的 一 个 副本 


守护 进程 的 每 个 副本 都 将 试图 创建 一 个 文件 ， 并 将 其 进程 ID 写 到 


该 文件 中 。 这 使 管理 人 员 易 于 标识 该 进程 。 如 果 该 文件 已 经 加 了 锁 ， 
那么 lockfile 范 数 将 失败 ，errno 设 置 为 EACCES 或 EAGAIN， 图 13-6 中 的 
函数 返回 1， 表 明 该 守护 进程 已 在 运行 。 否 则 将 文件 长 度 截 断 为 0， 将 
进程 ID 写 入 该 文件 ， 图 13-6 中 的 范 数 返回 0。 


需要 将 文件 长 度 截 断 为 0， 其 原因 是 之 前 的 守护 进程 实例 的 进程 ID 
字符 串 可 能 长 于 调用 此 画 数 的 当前 进程 的 进程 ID 字 符 串 。 例 如 ， 若 以 
前 的 守护 进程 的 进程 ID 是 12345， 而 新 实例 的 进程 ID 是 9999， 那 么 将 此 
进程 ID 写 入 文件 后 ， 在 文件 中 留 下 的 是 99995。 将 文件 长 度 截断 为 0 就 
解决 了 此 问题 。 


13.6 守护 进程 的 


在 UNIX 系 统 中 ， 守 护 进 程 遵循 下 列 通用 惯例 。 

* 若 守护 进程 使 用 锁 文 件 ， 那 么 该 文件 通常 存储 在 /var/run 目 杂 中 。 
然而 需要 注意 的 是 ， 守 护 进 程 可 能 需要 具有 超级 用 户 权 限 才 能 在 此 目 
录 下 创建 文件 。 锁 文件 的 名 字 通 常 是 name.pid， 其 中 ，name 是 该 守护 进 
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是 /varrun/crond.pid ° 

* 若 守护 进程 支持 配置 选项 ， 那 么 配置 文件 通常 存放 在 /etc 目 录 中 。 
配置 文件 的 名 字 通 常 是 name.conf， 其 中 ，name 是 该 守护 进程 或 服务 的 
名 字 。 例 如 ，syslogd 守 护 进 程 的 配置 文件 通常 是 /etc/syslog.conf ° 

“守护 进程 可 用 命令 行 启 动 ， 但 通常 它们 是 由 系统 初始 化 脚本 之 一 

(/etc/rc* 或 /etc/init.d/*) 启动 的 。 如 果 在 守护 进程 终止 时 ， 应 当 自 动 地 
重新 启动 它 ， 则 我 们 可 在 /etwinittab 中 为 该 守护 进程 包括 respawn 记 录 
项 ， 这 样 ，init 就 将 重新 启动 该 守护 进程 。 (假定 系统 使 用 System VX 
格 的 init 命 令 。) 

“ 右 一 个 守护 进程 有 一 个 配置 文件 ， 那 么 当 该 守护 进程 启动 时 会 读 
该 文件 ， 但 在 此 之 后 一 般 束 不 会 再 查看 它 。 若 某 个 管理 员 更 改 了 配置 
文件 ， 那 么 该 守护 进程 可 能 需要 被 停止 ， 然 后 再 启动 ， 以 使 配置 文件 
的 更 改 生 效 。 为 避免 此 种 太 烦 ， 某 些 守 护 进程 将 捕捉 SIGHUP 信 和 号 ， 当 


它们 接收 到 该 信号 时 ， 重 新 读 配 置 文件 。 因 为 守护 进程 并 不 与 终端 相 
结合 ， 它 们 或 者 是 无 控制 终端 的 会 话 首 进程 ， 或 者 是 孤儿 进程 组 的 成 
员 ， 所 以 守护 进程 没有 理由 期 望 接收 SIGHUP“。 于 是 ， 和 守护 进程 可 以 安 
全 地 重复 使 用 SIGHUP ° 

实例 

图 13-7 所 示 的 程序 说 明了 守护 进程 可 以 重读 其 配置 文件 的 一 种 方 
法 。 该 程序 使 用 sigwait 以 及 多 线程 ， 对 此 我 们 已 经 在 12.8 节 讨论 过 。 


#include "apue.h" 
#include <pthread.h> 
#include <syslog.h> 


sigset_t mask; 
extern int already running (void); 


void 
reread(void) 
{ 

[9 uos. FH 
) 


void * 
thr_fn (void *arg) 
{ 


int err, signo; 


for (;;) { 
err - sigwait(&mask, &signo); 
if (err != 0) { 
Syslog (LOG ERR, "sigwait failed"); 
exit(1); 


switch (signo) ( 

case SIGHUP: 
Syslog(LOG INFO, "Re-reading configuration file"); 
reread(); 
break; 


case SIGTERM: 
Syslog(LOG INFO, "got SIGTERM; exiting"); 


exit(0); 


default: 
syslog (LOG INFO, "unexpected signal %d\n", signo); 


} 
return (0); 


(int argc, char *argv[]) 


int err; 
pthread_t tid? 
char xema 


struct sigaction sa; 


if ((cmd = strrchr(argv[0], '/')) == NULL) 
cmd = argv[0]; 

else 
cmd++; 


/* 

* Become a daemon. 
x 

daemonize (cmd) ; 


/* 
* Make sure only one copy of the daemon is running. 
2/4 
if (already running()) { 
syslog (LOG ERR, "daemon already running"); 
exit(1); 


/* 
* Restore SIGHUP default and block all signals. 
ey: 
sa.sa_handler = SIG DFL; 
sigemptyset(&sa.sa mask); 
sa.sa flags = 0; 
if (sigaction(SIGHUP, &sa, NULL) < 0) 
err quit("$s: can't restore SIGHUP default"); 
sigfillset(&mask); 
if ((err = pthread sigmask(SIG BLOCK, &mask, NULL)) !- 0) 
err exit(err, "SIG BLOCK error"); 


* Create a thread to handle SIGHUP and SIGTERM. 


err - pthread create(&tid, NULL, thr fn, 0); 


图 13-7 守护 进程 重读 配置 文件 


该 程序 调用 了 图 13-1 中 的 daemonize 来 初始 化 守护 进程 。 从 该 函数 
返回 后 ， 调 用 图 13-6 中 的 already_running 芳 数 以 确保 该 守护 进程 只 有 一 
个 副本 在 运行 。 到 达 这 一 点 时 ，SIGHUP 信 号 仍 被 忽略 ， 所 以 需 恢 复 对 
该 信号 的 系统 默认 处 理 方 式 ; 否则 调用 sigwait 的 线程 决 不 会 见 到 该 信 
5 o 

如 同 对 多 线程 程序 所 推荐 的 那样 ， 阻 塞 所 有 信号 ， 然 后 创建 一 个 
线程 处 理 信 号 。 该 线程 的 唯一 工作 是 等 待 SIGHUP 和 SIGTERM。 当 接 
收 到 SIGHUP 信 号 时 ， 该 线程 调用 reread 函 数 重读 它 的 配置 文件 。 当 它 
接收 到 SIGTERM 信 号 时 ， 会 记录 消息 并 退出 。 

回顾 图 10-1，SIGHUP 和 SIGTERM 的 默认 动作 是 终止 进程 。 因 为 我 
们 阻塞 了 这 些 信号 ， 所 以 当 SIGHUP 和 SIGTERM 的 其 中 一 个 被 发 送 到 
守护 进程 时 ， 守 护 进程 不 会 消亡 。 作 为 替代 ， 调 用 sigwait 的 线程 在 返 
回 时 将 指示 已 接收 到 该 信号 。 

实例 

并 非 所 有 守护 进程 都 是 多 线程 的 。 图 13-8 中 的 程序 说 明 一 个 单线 
程 守护 进程 如 何 捕捉 SIGHUP 并 重读 其 配置 文件 。 


#include "apue.h" 
#include <syslog.h> 
#include <errno.h> 


extern int lockfile(int); 
extern int already running (void); 


void 
reread (void) 
( 
YR oo Pf 


void 

sigterm(int signo) 

{ 
syslog(LOG_INFO, "got SIGTERM; 
exit (0); 


exiting"); 


void 

sighup(int signo) 

( 
Syslog(LOG INFO, "Re-reading configuration file"); 
reread(); 


main(int argc, char *argv[]) 


char *cmd; 
struct sigaction sa; 


if ((cmd = strrchr(argv[0], '/')) == NULL) 
cmd = argv[0]; 

else 
cmd++; 


/* 
* Become a daemon. 
xA 


daemonize (cmd); 


/* 
* Make sure only one copy of the daemon is running. 
if 
if (already_running()) { 
syslog(LOG_ERR, "daemon already running"); 


exit(1); 
) 
/* 
* Handle signals of interest. 
*/ 


sa.sa handler = sigterm; 

sigemptyset(&sa.sa mask); 

sigaddset(&sa.sa mask, SIGHUP); 

sa.sa flags = 0; 

if (sigaction(SIGTERM, &sa, NULL) < 0) { 
syslog(LOG_ERR, "can't catch SIGTERM: $s", strerror(errno) ); 
exit(1); 

) 

sa.sa handler = sighup; 

sigemptyset(&sa.sa mask); 

sigaddset(&sa.sa mask, SIGTERM); 

sa.sa flags - 0; 

if (sigaction(SIGHUP, &sa, NULL) « 0) ( 
Syslog(LOG ERR, "can't catch SIGHUP: $s", strerror(errno)); 


exit(1); 
} 
/* 
* Proceed with the rest of the daemon. 
ai 


exit(0); 


图 13-8 守护 进程 重读 配置 文件 的 另 一 种 实现 

在 初始 化 守护 进程 后 ， 我 们 为 SIGHUP 和 SIGTERM 配 置 了 信号 处 
理 程序 。 可 以 将 重读 逻辑 放 在 信号 处 理 程序 中 ， 也 可 以 只 在 信号 处 理 
程序 中 设置 一 个 标志 ， 并 由 守护 进程 的 主线 程 完 成 所 有 的 工作 。 


13.7 进程 - 进程 模型 


守护 进程 常常 用 作 服 务 器 进程 。 确 实 ， 我 们 可 以 称 图 13-2 中 的 
syslogd 进 程 为 服务 器 进程 ， 用 户 进 程 (客户 进程 ， 用 UNIX 域 数据 报 套 
BET I8 RC ACTA ° 

一 般 而 言 ， 服 务 器 进程 等 待 客户 进程 与 其 联系 ， 提 出 某 种 类 型 的 
服务 要 求 。 图 13-2 中 ， 由 syslogd 服 务 右 进程 提供 的 服务 是 将 一 条 出 销 
消息 记录 到 日 志文 件 中 。 

图 13-2 中 ， 客 户 进 程 和 服务 右 进 程 之 间 的 通信 是 单 同 的 。 客 户 进 程 
癌 服 务 占 进程 发 送 服务 请 求 ， 服 务 卓 进程 则 不 同 客户 进程 回 送 任何 消 
轧 。 在 下 面 有 关 进 程 通信 的 几 章 中 ， 我 们 将 见 到 大 量 客户 进程 和 服务 


堪 进 程 之 间 双 回 通 信 的 实例 。 客 户 进 程 癌 服务 融 进 程 发 送 请 求 ， 服 务 
亏 进 程 则 回 客 户 进程 回 送 应 答 。 


在 服务 器 进程 中 调用 fork 然 后 exec 另 一 个 程序 来 向 客户 进程 提供 服 
务 是 很 常见 的 。 这 些 服务 器 进程 通常 管理 着 多 个 文件 描述 符 : 通信 端 
RO 配置 文 件 、 日 志文 件 和 类 似 的 文件 。 最 好 的 情况 下 ， 让 子 进程 中 
的 这 些 文件 接 述 符 保 持 打 开 状 态 并 无 大 碍 ， 因 为 它们 很 可 能 不 会 被 在 
子 进程 中 执行 的 程序 所 使 用 ， 尤 其 是 那些 与 服务 器 剖 无 关 的 程序 。 最 
坏 情况 下 ， 保 持 它 们 的 打开 状态 会 导致 安全 问题 一 一 被 执行 的 程序 可 


能 有 一 些 恶 意 行 为 ， 如 更 改 服 务 器 端 配 置 文件 或 欺骗 客户 端 程序 使 其 
认为 正在 与 服务 需 端 通信 ， 从 而 获取 未 授权 的 信息 。 

解决 此 问题 的 一 个 简单 方法 是 对 所 有 被 执行 程序 不 需要 的 文件 撒 
述 符 设置 执行 时 关闭 (cose-on-exec) 标志 。 图 13-9 展 示 了 一 个 可 以 用 


来 在 服务 器 端 进 程 中 执行 上 述 工作 的 函数 。 


#include "apue.h" 
#include «fcntl.h» 
int 

set cloexec(int fd) 


{ 
int val; 


if ((val = fcntl(fd, F GETFD, 0)) < 0) 


return (-1); 


val |= FD_CLOEXEC; /* enable close-on-exec */ 


return(fcntl(fd, F SETFD, val)); 


图 13-9 设置 执行 时 关闭 标志 


13.8 小 结 


在 大 多 数 UNIX 系 统 中 ， 和 守护 进 程 是 一 直 运 行 的 。 为 了 初始 化 我 们 
目 己 的 进程 ， 使 之 作为 守护 进程 运行 ， 需 要 一 些 审慎 的 思索 并 理解 第 9 
章 中 说 明 的 进程 之 间 的 关系 。 本 章 开 发 了 一 个 可 由 守护 进程 调用 的 能 
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因为 守护 进程 通常 没有 控制 终端 ， 所 以 本 章 还 讨论 了 守护 进程 记 
杂 出 错 消 忌 的 几 种 方法 。 我 们 讨论 了 在 大 多 数 UNIX 系 统 中 ， 守 护 进 程 
遵循 的 者 干 惯例 ， 给 出 了 几 个 如 何 实 现 某 些 惯例 的 实例 。 


习题 


13.1 从 图 13-2 可 以 推测 出 ， 直 拉 调 用 openlog 或 第 一 次 调用 syslog 都 
可 以 初始 化 syslog 设 施 ， 此 时 一 定 要 打开 用 于 UNIX 域 数 据 报 套 接 字 的 
特殊 设备 文件 /dewlog。 如 果 调 用 openlog 前 ， 用 户 进 程 《守护 进程 ) 先 
调用 了 chroot， 结 果 会 怎么 样 ? 
13.2 [21] 13.215 Fps 输出 的 示例 。 唯 一 一 个 不 是 会 话 首 进程 的 用 
户 层 守护 进程 是 rsyslogd 进 程 。 请 解释 为 什么 rsyslogd 守 护 进 程 不 是 会 话 
BH ° 
13.3 列 出 你 系统 中 所 有 有 效 的 守护 进程 ， 并 说 明 它 们 各 目的 功 


能 

13.4 编写 一 段 程序 调用 网 13-1 中 daemonize 函 数 。 调 用 该 函数 后 ， 
它 已 成 为 守护 进程 ， 再 调用 getlogin ( 见 8.15 节 ) 查看 该 进程 是 否 有 登 
孙 名 。 将 结果 打印 到 一 个 文件 中 。 


14 级 TI/O 


14.1 引言 


本 章 涵 盖 众 多 概念 和 画 数 ， 我 们 把 它们 统统 都 放 到 高 级 MO 下 讨 
i£: JESASEVO ` WRD ^ VO 多 路 转 接 (select 和 poll 函数 ) + HA 
I/O ` readv 和 writev 函数 以 及 存储 映射 VO (mmap) » 8153€ 45817 
章 中 的 进程 间 通 信 以 及 以 后 各 章 中 的 很 多 实例 都 要 使 用 本 章 所 描述 的 


14.2 非 阻塞 VO 


10.5 太 中 曾 将 系统 调用 分 成 两 类 : “低速 ?系统 调用 和 其 他 。 低 速 系 
统 调用 是 可 能 会 使 进程 永远 阻塞 的 一 类 系统 调用 ， 包 括 : 

“如 果 某 些 文件 类 型 (如 读 管 道 、 终 端 设备 和 网 络 设备 ， 的 数据 并 
不 存在 ， 读 操作 可 能 会 使 调用 者 永远 阻塞 ; 

“如 果 数 据 不 能 被 相同 的 文件 类 型 立即 接受 (如 管道 中 无 空间 、 网 
络 流 控 制 ) ， 写 操作 可 能 会 使 调用 者 永远 阻塞 ; 

“在 某 种 条 件 发 生 之 前 打开 某 些 文件 类 型 可 能 会 发 生 阻 塞 (如 要 打 
开 一 个 终端 设备 ， 需 要 先 等 待 与 之 连接 的 调制 解 调 器 应 答 ， 又 如 若 以 


只 写 模 式 打 开 FIFO， 那 么 在 没有 其 他 进程 已 用 恋 模 式 打开 该 FIFO 时 也 


要 等 待 ) ; 
对 已 经 加 上 强制 性 记录 锁 的 文件 进行 读 写 ; 
oe ioctl HENE; 


RACE RETA A NBL 〈 见 第 15 章 ) 。 

我 们 也 曾 说 过 ， 虽 然 恋 写 人 磁盘 文件 会 暂时 阻塞 调用 者 ， 但 并 不 能 
将 与 磁盘 IO 有 关 的 系统 调用 视 为 “低速 ”。 

非 阻塞 VO 使 我 们 可 以 发 出 open 、read 和 write 这 样 的 MO 操作 ， 并 使 
这 些 操作 不 会 永远 阻塞 。 如 果 这 种 操作 不 能 完成 ， 则 调用 立即 出 错 返 
回 ， 表 示 该 操作 如 继续 执行 将 阻塞 。 

对 于 一 个 给 定 的 描述 符 ， 有 两 种 为 其 指定 非 阻 塞 IO 的 方法 。 

(1) 如 果 调 用 open 获 得 描述 符 ， 则 可 指定 O_NONBLOCK 标 志 
( 见 3.3 节 ) 。 
(2) 对 于 已 经 打开 的 一 个 描述 符 ， 则 可 调用 fcntl， 由 该 函数 打开 
O NONBLOCK 文件 状态 标志 ( 见 3.14 节 ) 。 图 3-12 中 的 函数 可 用 来 为 
一 个 描述 符 打 开 任 一 文件 状态 标志 。 

SystemV 的 早期 版 本 使 用 标志 O_NDELAY 指 定 非 阻塞 方式 。 在 这 
HESystem V 版 本 中 ， 如 有 果 无 数据 可 读 ， 则 read 返 回 0。 而 UNIX 系 统 又 常 
将 read 时 返回 值 0 解释 为 文件 结束 ， 两 者 有 所 混 消 。POSIX.1 提 供 了 一 个 
非 阻 塞 标 志 ， 它 的 名 字 和 话 义 都 与 O NDELAY 不 同 。 确 实 ， 在 System 
V 的 早期 版 本 中 ， 当 从 read 得 到 返回 值 0 时 ， 我 们 并 不 知道 该 调用 是 阻 
塞 了 还 是 遇 到 了 文件 尾 端 。POSIX.1 要 求 ， 对 于 一 个 非 阻塞 的 描述 符 如 
果 无 数据 可 读 ， 则 read 返 回 -1，errno 被 设置 为 CAGAIN。System V 派 生 
的 某 些 平台 既 支 持 较 旧 的 ONDELAY , X x $$ POSIX. 的 
O_NONBLOCK， 但 在 本 书 的 实例 中 只 使 用 POSIX.1 规 定 的 特征 。 较 旧 
的 O NDELAY 只 是 为 了 向 后 兼容 ， 不 应 在 新 应 用 程序 中 使 用 。 


4.3BSD 为 fcntl 提 供 了 FNDELAY 标 志 ， 其 语义 也 稍 有 区 别 。 它 不 只 
影响 描述 符 的 文件 状态 标志 ， 还 将 终端 设备 或 套 接 字 的 标志 更 改 成 非 
阻塞 的 ， 因 此 不 仅 影响 共享 同一 文件 表 项 的 用 户 ， 而 且 对 终端 或 套 接 
字 的 所 有 用 户 起 作用 (4.3BSD 非 阻塞 VO 只 对 终端 和 套 接 字 起 作 
H) 。 另 外 ， 如 果 对 一 个 非 阻 塞 描述 符 的 操作 不 能 无 阻塞 地 完成 ， 那 
么 4.3BSD 返 回 EWOULDBLOCK。 现 今 ， 基 于 BSD 的 系统 提供 POSIX.1 
的 O_NONBLOCK 标 志 ， 并 且 将 EWOULDBLOCK 定 义 为 与 POSIX.1 的 
EAGAIN 相 同 。 这 些 系统 提供 与 其 他 POSIX 兼 容 系统 相 一 致 的 非 阻塞 语 
义 : 文件 状态 标志 的 更 改 影响 同一 文件 表 项 的 所 有 用 户 ， 但 与 通过 其 
他 文件 表 项 对 同一 设备 的 访问 无 关 。 

实例 

图 14-1 中 的 程序 是 一 个 非 阻塞 UO 的 实例 ， 它 从 标准 输入 读 500 000 
字 节 ， 并 试图 将 它们 写 到 标准 输出 上 。 该 程序 先 将 标准 输出 设置 为 非 
阻塞 的 ， 然 后 用 for 循 环 进行 输出 ， 每 次 write 调用 的 结果 都 在 标准 错误 
上 打印 。 画 数 clr 有 类 似 于 图 3-12 中 的 set_ f。 这 个 新 函数 清除 1 个 或 多 个 
标志 位 。 


#include "apue.h" 
#include <errno.h> 
#include <fcntl.h> 


char buf [500000]; 


int 

main(void) 

( 
int ntowrite, nwrite; 
char spire? 


ntowrite = read(STDIN FILENO, buf, sizeof (buf)); 
fprintf(stderr, "read $d bytes\n", ntowrite) ; 


set fl(STDOUT FILENO, O_NONBLOCK); /* set nonblocking */ 

ptr = buf; 

while (ntowrite > 0) { 
errno = 0; 
nwrite = write(STDOUT_FILENO, ptr, ntowrite); 
fprintf(stderr, "nwrite = %d, errno = $dMn", nwrite, errno); 


if (nwrite > 0) { 
ptr += nwrite; 
ntowrite -= nwrite; 


} 


clr fl(STDOUT FILENO, O_NONBLOCK); /* clear nonblocking */ 


exit (0); 


图 14-1 长 的 非 阻塞 write 


若 标 准 输 出 是 普通 文件 ， 则 可 以 期 望 write 只 执行 一 次 。 
$ 1s -] /etc/services 打印 文件 长 度 
-rW-r--r-- 1 root 677959 Jun 23 2009 /etc/services 


$ ./a.out < /etc/services > temp.file 先 试 一 个 普通 文件 
read 500000 bytes 
nwrite = 500000, errno = 0 一 次 写 


$ Is -l temp.file 检验 输出 文件 长 度 


-rW-rw-r-- 1 sar 500000 Apr 1 13:03 temp.file 


但 是 ， 大 标准 输出 征 终端 ， 则 期 望 write 有 时 返回 小 于 500 000 的 一 
个 数字 ， 有 时 返回 错误 。 下 面 是 运行 结果 : 


$ /a.out < /etc/services 2>stderr.out 终端 至 输出 
大 量 输出 至 终端 .…... 


$ cat stderr.out 

read 500000 bytes 
nwrite = 999, errno = 0 
nwrite = -1, errno = 35 
nwrite = -1, errno = 35 
nwrite = -1, ermo = 35 
nwrite = -1, errno = 35 
nwrite = 1001, errno = 0 
nwrite = -1, errno = 35 
nwrite = 1002, errno = 0 
nwrite = 1004, errno = 0 
nwrite = 1003, errno = 0 
nwrite = 1003, errno = 0 
nwrite = 1005, errno = 0 
nwrite = -1, errno = 35 61 SR EH 


nwrite = 1006, errno = 0 
nwrite = 1004, errno = 0 
nwrite = 1005, errno = 0 
nwrite = 1006, errno = 0 
nwrite = -1, errno = 35 108 个 此 类 错误 


nwrite = 1006, errno = 0 


nwrite = 1005, errno = 0 
nwrite = 1005, errno = 0 
nwrite = -1, errno = 35 681 个 此 类 销 误 


dg 


等 
本 本 


nwrite = 347, errno = 0 

在 该 系统 上 ，errno 值 35 对 应 的 是 EAGAIN 。 终 端 驱动 程序 一 次 能 
接受 的 数据 量 随 系统 而 变 。 有 具体 结果 还 会 因 登 录 系 统 时 所 使 用 的 方式 
的 不 同 而 不 同 : 在 系统 控制 台 上 登录 、 在 硬 接线 的 终端 上 登录 或 用 伪 
终端 在 网 络 连 接 上 登录 。 如 果 你 在 终端 上 运行 一 个 窗口 系统 ， 那 么 也 
是 经 由 伪 终 端 设备 与 系统 交互 。 

在 此 实例 中 ， 程 序 发 出 了 9 000 多 个 write 调用 ， 但 是 只 有 500 个 真正 
输出 了 数据 ， 其 余 的 都 只 返回 了 错误 。 这 种 形式 的 循环 称 为 轮 询 ， 在 
多 用 户 系 统 上 用 它 会 浪费 CPU 时 间 。14.4 节 将 介绍 非 阻 塞 描 述 符 的 IO 
多 路 转 接 ， 这 是 进行 这 种 操作 的 一 种 比较 有 效 的 方法 。 

有 时 ， 可 以 将 应 用 程序 设计 成 使 用 多 线程 的 ( 见 第 11 章 ) ， 从 而 
避免 使 用 非 阻塞 W/O。 如 若 我 们 能 在 其 他 线程 中 继续 进行 ， 则 可 以 允许 
单个 线程 在 VO 调用 中 阻塞 。 这 种 方法 有 时 能 简化 应 用 程序 的 设计 ( 见 
第 21 章 ) ， 但 是 ， 线 程 间 同步 的 开销 有 了 时 却 可 能 增加 复杂 性 ， 于 是 导 
致 得 不 偿 失 的 后 果 。 


14.3 记录 锁 


当 两 个 人 同时 编辑 一 个 文件 时 ， 其 后 采 将 如 何 呢 ? 在 大 多 数 UNIX 
系统 中 ， 该 文件 的 最 后 状态 取决 于 写 该 文件 的 最 后 一 个 进程 。 但 是 对 
于 有 些 应 用 程序 ， 如 数据 库 ， 进 程 有 时 需要 确保 它 正在 单独 写 一 个 文 


件 。 为 了 回 进 程 提供 这 种 功能 ， 商 用 UNIX 系 统 提 供 了 记录 锁 机 制 。 
(第 20 章 包含 了 使 用 记录 锁 的 数据 库 函 数 库 。) 

记录 锁 (record locking) 的 功能 是 : 当 第 一 个 进程 正在 读 或 修改 文 
件 的 某 个 部 分 时 ， 使 用 记录 锁 可 以 阻止 其 他 进程 修改 同一 文件 区 。 对 
T UNIX ARMS, “记录 ”这 个 词 是 一 种 误 用 ， 因 为 UNIX 系统 内 核 
根本 没有 使 用 文件 记录 这 种 概念 。 一 个 更 适合 的 术语 可 能 是 字 万 范围 
锁 (byte-range locking) ， 因 为 它 锁定 的 只 是 文件 中 的 一 个 区 域 (也 可 
能 是 整个 文件 ) 。 

Y. se 

对 早期 UNIX 系 统 的 其 中 一 个 批评 是 它们 不 能 用 来 运行 数据 库 系 
统 ， 其 原因 是 这 些 系 统 不 支持 对 部 分 文件 加 锁 。 在 UNIX 系 统 寻 找 进入 
商用 计算 环境 的 途径 时 ， 很 多 系统 开发 小 组 以 各 种 不 同方 式 增加 了 对 
TSR BEY SCH ° 

FARHAN (8 be 4 RAS ROS FF flock ER ZA o 12 ERE 2, Beo] 29 I CP IH 
锁 ， 不 能 对 文件 中 的 一 部 分 加 锁 。 

SVR3 通 过 fcntl 函 数 增加 了 记录 锁 功 能 。 在 此 基础 上 构造 了 lockf 范 
数 ， 它 提供 了 一 个 人 简化 的 接口 。 这 些 函 数 允 许 调用 者 对 一 个 文件 中 任 
意 字 节 数 的 区 域 加 锁 ， 长 至 整个 文件 ， 短 至 文件 中 的 一 个 字 节 。 

POSIX.1 标 准 的 基础 是 fcntl 方 法 。 图 14-2 列 出 了 各 种 系统 提供 的 不 
同形 式 的 记录 锁 。 注 意 ，Single UNIX Specification 在 其 XSI 扩 展 中 包括 
了 lockf ° 


FreeBSD 8.0 


Linux 3.2.0 
Mac OS X 10.6.8 
Solaris 10 


图 14-2 各 种 UNIX 系 统 支 持 的 记录 锁 形式 


本 市 最 后 部 分 将 说 明 建 议 性 锁 和 强制 性 锁 之 间 的 区 别 。 本 书 只 介 
绍 POSIX.1 的 fcntl 锁 。 

记录 锁 是 1980 年 由 John Bass 最 早 添加 到 V7 上 的 。 内 核 中 相应 的 
系统 调用 入 口 项 是 名 为 locking 的 函数 。 此 函数 所 供 了 强制 性 记录 锁 功 
能 ， 它 被 用 在 很 多 System II 版 本 中 。Xenix 系 统 采用 了 此 函数 ， 某 些 基 
于 Itel 的 System V 派 生 版 本 ， 如 OpenServer 5， 在 Xenix 兼 容 库 中 仍旧 文 
TE HAY © 

2. fcntl 记 录 锁 

3.14 广 中 已 经 给 出 了 fantl 芳 数 的 原型 ， 为 了 客 说 方便 ， 这 里 再 重复 
= 


#include <fcnt1.h> 


int fcnt1(int fd, int cmd, .../* struct flock *flockptr */); 
返回 值 : 若 成 功 ， 依 赖 于 cmd (WF) ， 否 则 ， 返 回 -1 
对 于 记录 锁 ，cmd 是 F_GETLK、F_SETLK 或 F_SETLKW 。 第 三 个 
参数 (我 们 将 调用 flockptr) 是 一 个 指向 flock 结 构 的 指针 。 


struct flock { 


short ] type; /* F RDLCK, F WRLCK, or F UNLCK */ 
short | whence; /* SEEK, SET, SEEK CUR, or SEEK END */ 
off tl start; /* offset in bytes, relative to l whence */ 
off tl len; /* length, in bytes; 0 means lock to EOF */ 
pid tl pid; /* returned with F GETLK */ 

}; 

对 flock 结 构 说 明 如 下 。 


Aras BAMA: F RDLCK (FE iH) ^F WRLCK (独占 性 
写 锁 ) 或 F_UNLCK (解锁 一 个 区 域 ) 。 

“要 加 锁 或 解锁 区 域 的 起 始 字 市 偏 移 量 (1_start 和 ]_whence) ° 

ORBE HERE (len) 。 


“进程 的 ID (1 pid) 持 有 的 锁 能 阻塞 当前 进程 ([XBIF GETLKjE 
回 ) 。 

关于 加 锁 或 解锁 区 域 的 说 明 还 要 注意 下 列 几 项 规则 e 

“指定 区 域 起 始 偏 移 量 的 两 个 元 素 与 lseek 函 数 〈 见 3.6 节 ) 中 最 后 两 
个 参数 类 似 。1whence 可 选用 的 值 是 SEEK_SET ^ SEEK, CUR 或 
SEEK_END 。 

“ 锁 可 以 在 当前 文件 尾 端 处 开始 或 者 越过 尾 端 处 开始 ， 但 是 不 能 在 
文件 起 始 位 置 之 前 开始 。 

如若 ]_len 为 0， 则 表示 锁 的 范围 可 以 扩展 到 最 大 可 能 偏 移 量 。 这 
意味 着 不 管 向 该 文件 中 追加 写 了 多 少数 据 ， 它 们 都 可 以 处 于 锁 的 范围 
内 (不 必 猿 测 会 有 和 多少 字 节 被 追加 写 到 了 文件 之 后 ) ， 而 且 起 始 位 置 
可 以 是 文件 中 的 任意 一 个 位 置 。 

为 了 对 整个 文件 加 锁 ， 我 们 设置 ]_start 和 ]_whence 指 向 文件 的 起 始 
ME, 并且 指 定 长 度 (Llen) 为 0。 (有 多 种 方法 可 以 指定 文件 起 始 
人 处， 但 常用 的 方法 是 将 ]_start 指 定 为 0，]1_whence 指 定 为 SEEK_SET。) 

上 面 提 到 了 两 种 类 型 的 锁 ;， 共享 读 锁 (]_type 为 L_RDLCK) 和 独 
占 性 写 锁 (L_WRLCK) 。 基 本 规则 是 : 任意 多 个 进程 在 一 个 给 定 的 字 
节 上 可 以 有 一 把 共享 的 读 锁 ， 但 是 在 一 个 给 定 字 节 上 只 能 有 一 个 进程 
有 一 把 独占 写 锁 。 进 一 步 而 言 ， 如 果 在 一 个 给 定 字 节 上 已 经 有 一 把 或 
多 把 读 锁 ， 则 不 能 在 该 字 闻 上 再 加 写 锁 ; 如 果 在 一 个 字 节 上 已 经 有 一 
把 独占 性 写 锁 ， 则 不 能 再 对 它 加 任何 读 锁 。 在 图 14-3 中 示 出 了 这 些 兼容 
性 规则 o 


请 求 


| WS | SH | 

a | 
有 -把 或 
| 


图 14-3 不 同类 型 锁 彼 此 之 间 的 兼容 

上 面 说 明 的 兼容 性 规则 适用 于 不 同 进程 提出 的 锁 请 求 ， 并 不 适用 
于 单个 进程 提出 的 多 个 锁 请 求 。 如 果 一 个 进程 对 一 个 文件 区 间 已 经 有 
了 一 把 锁 ， 后 来 该 进程 又 企图 在 同一 文件 区 间 再 加 一 把 锁 ， 那 么 新 锁 
将 蔡 换 已 有 锁 。 因 此 ， 若 一 进程 在 某 文件 的 16~32 ST KIA FES 
锁 ， 然 后 又 试图 在 167-32 字 节 区 间 加 一 把 读 锁 ， 那 么 该 请 求 将 成 功 执 
行 ， 原 来 的 写 锁 会 被 替换 为 读 锁 。 

加 读 锁 时 ， 该 描述 符 必 须 是 读 打 开 。 加 写 锁 时 ， 该 描述 符 必 须 是 
写 打 开 。 

下 面 说 明 一 下 fcnt 函 数 的 3 种 命令 。 

F GETLK 判断 由 flockptr 所 描述 的 锁 是 否 会 被 另外 一 把 锁 所 排斥 

(阻塞 ) 。 如 果 存 在 一 把 锁 ， 它 阻止 创建 由 flockptr 所 描述 的 锁 ， 则 该 

现 有 锁 的 信息 将 重 写 flockptr 指 向 的 信息 。 如 果 不 存在 这 种 情况 ， 则 除 
了 将 ]_type 设 置 为 F_UNLCK 之 外 ， flockptr 所 指向 结构 中 的 其 他 信息 保 
持 不 变 。 

F SETLK 设置 由 flockptr 所 描述 的 锁 。 如 果 我 们 试图 获得 一 把 读 
锁 (type NF_RDLCK) 或 写 锁 (1_type 为 F_WRLCK) ， 而 兼容 性 规 


当前 区 域 


则 阻止 系统 给 我 们 这 把 锁 ， 那 么 fcnt 会 立即 出 错 返 回 ， 此 时 ermno 设 置 
为 EACCES 或 EAGAIN ° 

虽然 POSIX.1 允许 实现 返回 这 两 种 出 错 代 码 中 的 任何 一 种 ,但 本 
书 说 明 的 4 种 实现 在 锁 请 求 不 能 得 到 满足 时 ， 都 返回 EAGAIN 。 

此 命令 也 用 来 清除 由 flockptr 指 定 的 锁 (1_type 为 F_UNLCK) 。 

F_SETLKW 这 个 命令 是 F_SETLK 的 阻塞 版 本 (命令 名 中 的 W 表 示 
SEER (wai) ) 。 如 果 所 请 求 的 读 锁 或 写 锁 因 另 一 个 进程 当前 已 经 对 所 
请 求 区 域 的 某 部 分 进行 了 加 锁 而 不 能 被 授予 ， 那 么 调用 进程 会 被 置 为 
休眠 。 如 有 果 请 求 创建 的 锁 已 经 可 用 ， 或 者 休眠 由 信和 号 中 断 ， 则 该 进程 
被 唤醒 。 

应 当 了 解 ， 用 F_GETLK 测 试 能 否 建立 一 把 锁 ， 然 后 用 F_SETLK 或 
F_SETLKW 企 图 建立 那 把 锁 ， 这 两 者 不 是 一 个 原子 操作 。 因 此 不 能 保 
证 在 这 两 次 fcntl 调 用 之 间 不 会 有 男 一 个 进程 插入 并 建立 一 把 相同 的 锁 。 
如 果 不 希 望 在 等 等 锁 变 为 可 用 时 产生 阻塞 ， 就 必须 处 理由 F_SETLK 返 
回 的 可 能 的 出 错 。 

注意 ，POSIX.1 并 没有 说 明 在 下 列 情况 下 将 发 生 什 么 一 个 进程 
在 某 个 文件 的 一 个 区 间 上 设置 了 一 把 读 锁 ， 第 二 个 进程 在 试图 对 同一 
文件 区 间 加 一 把 写 锁 时 阻塞 ， 然 后 第 三 个 进程 则 试图 在 同一 文件 区 间 
上 得 到 男 一 把 读 锁 。 如 有 果 第 三 个 进程 只 是 因为 读 区 间 已 有 一 把 读 锁 ， 
而 被 允许 在 该 区 间 放 置 另 一 把 读 锁 ， 那 么 这 种 实现 就 可 能 会 使 希望 加 
写 锁 的 进程 俄 死 。 因此 ， 当 对 同一 区 间 加 另 一 把 读 锁 的 请 求 到 达 时 ， 
提出 加 写 锁 而 阻塞 的 进程 需 等 待 的 时 间 延 长 了 。 如 果 加 读 锁 的 请 求 来 
得 很 频繁 ， 使 得 该 文件 区 间 始 终 存在 一 把 或 几 把 读 锁 ， 那 么 欲 加 写 锁 
的 进程 就 将 等 得 很 长 时 间 。 

在 设置 或 释放 文件 上 的 一 把 锁 时 ， 系 统 按 要 求 组 合 或 分 裂 相 邻 
[X ° ff], Æ 100—199 字 节 是 加 锁 的 区 ， 需 解锁 第 150 字 节 ， 则 内 


核 将 维持 两 把 锁 ， 一 把 用 于 第 100~149 6 D, 5—1B8 HIT 358151--199 
字 节 。 图 14-4 说 明了 这 种 情况 下 的 字 节 范围 锁 。 


—— = — 
1 1 | [ 1 1 1 1 
55— 第 = 
| NE 1 1 加 锁 区 ! | | ! 加 锁 区 ， 
AEN mE | q PEN 1 1 1 1 ee tae 
| | | | | | 
100 199 100 149 151 199 
对 第 100 一 199 字 节 加 锁 后 的 文件 对 第 150 字 节 解锁 后 的 文件 


图 14-4 SORE TT YO, ESI RT 


假定 我 们 又 对 第 150 字 节 加 锁 ， 那 么 系统 将 会 再 把 3 个 相 邻 的 加 锁 
区 合并 成 一 个 区 〈 第 100~199 字 节 ) 。 其 结果 如 图 14-4 中 的 第 一 个 图 所 
示 ， 又 跟 开 始 的 时 候 一 样 了 。 

实例 :， 请求 和 释放 一 把 锁 

为 了 避免 每 次 分 配 flock 结 构 ， 然 后 又 填 入 ~ 可 以 用 图 14- 
5 所 示 的 程序 中 的 函数 lock_reg 来 处 理 所 有 这 些 细 


#include "apue.h" 
#include «fcntl.h» 


int 
lock reg(int fd, int cmd, int type, off t offset, int whence, off t len) 
{ 

struct, flock lock; 


lock.l type = type; /* F_RDLCK, F_WRLCK, F_UNLCK */ 

lock.l start = offset; /* byte offset, relative to l_whence */ 
lock.l whence - whence; /* SEEK SET, SEEK CUR, SEEK END */ 
lock.l len = len; /* #bytes (0 means to EOF) */ 


return(fcntl(fd, cmd, &lock)); 


图 14-5 加 锁 或 解锁 一 个 文件 区 域 的 画 数 
因为 大 多 数 锁 调用 是 加 锁 或 解锁 一 个 文件 区 域 (命令 F_GETLK 很 
少 使 用 ) ， 故 通常 使 用 下 列 5 个 宏 中 的 一 个 ， 这 5 个 宏 都 定义 在 apue.h 中 
( 见 附录 B) ° 


#define read lock(fd,offset,whence,len) \ 
lock reg((fd), F SETLK, F RDLCK, (offset), (whence), (len)) 
#define readw_lock(fd,offset,whence,len) \ 
lock reg((fd), F SETLKW, F_RDLCK, (offset), (whence), 
(len)) 
#define write lock(fd,offset,whence,len) \ 
lock reg((fd), F SETLK, F WRLCK, (offset), (whence), (len)) 
#define writew_lock(fd,offset,whence,len) \ 
lock_reg((fd), F_SETLKW, F_WRLCK, (offset), (whence), 
(len)) 
#define un lock(fd,offset,whence,len) \ 
lock reg((fd), F SETLK, F UNLCK, (offset), (whence), (len)) 
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实例 : 测试 一 把 锁 
图 14-6 中 定义 了 一 个 函数 lock_test， 我 们 将 用 它 测 试 一 把 锁 。 


#include "apue.h" 
#include «fcntl.h» 


pid t 
lock test(int fd, int type, off t offset, int whence, off t len) 
{ 
struct flock lock; 
lock.l type = type; /* F_RDLCK or F_WRLCK */ 
lock.l start = offset; /* byte offset, relative to l_whence */ 
lock.l whence = whence; /* SEEK SET, SEEK CUR, SEEK END */ 
lock.l len = len; /* #bytes (0 means to EOF) */ 


if (fenti (fd, F GETLK, &lock) < 0) 
err sys("fcntl error"); 


if (lock.l type == F UNLCK) 
return(0); /* false, region isn't locked by another proc */ 
return (lock.1_pid); /* true, return pid of lock owner */ 


Ed 14-6 测试 一 个 锁 条 件 的 函数 
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有 这 把 现 有 锁 的 进程 的 进程 ID ， 否 则 此 函数 返回 0。 通 种 用 下 面 两 个 安 
来 调用 此 函数 (它们 也 定义 在 apue.h 中 ) 

#define is read lockable(fd, offset, whence, len) \ 

(lock test((fd), F RDLCK, (offset), (whence), (len)) == 0) 
"define is write lockable(fd, offset, whence, len) ^ 
(lock test((fd), F WRLCK, (offset), (whence), (len)) == 0) 

注意 ， 进 程 不 能 使 用 lock test 函数 测试 它 上 自己 是 否 在 文件 的 某 一 
部 分 持 有 一 把 锁 。F_GETLK 命令 的 定义 说 明 ， 返 回信 息 指 示 是 否 有 现 
有 的 锁 阻 止 调 用 进程 设置 它 自己 的 锁 。 因 为 F_SETLK 和 F_SETLKW 命 
令 总 是 替换 调用 进程 现 有 的 锁 〈 若 已 存在 ) ， 所 以 调用 进程 决 不 会 阻 
塞 在 自己 持 有 的 锁 上 ， 于 是 ，F_GETLK 命 令 决 不 会 报告 调用 进程 自己 
持 有 的 锁 。 

实例 : 死 锁 

如 果 两 个 进程 相互 等 待 对方 持 有 并 且 不 释放 (锁定 ) 的 资源 时 ， 
则 这 两 个 进程 就 处 于 死 锁 状态 。 如 果 一 个 进程 已 经 控制 了 文件 中 的 一 
AMAK, Aa Ee CAT A MERE AY XI, AAC 
会 休眠 ， 在 这 种 情况 下 ， 有 发 生死 锁 的 可 能 性 。 

图 14-7 所 示 的 程序 给 出 了 一 个 死 锁 的 例子 。 子 进程 对 第 0 字 节 加 
锁 ， 父 进程 对 第 1 字 世 加 锁 。 然 后 ， 它 们 中 的 每 一 个 又 试图 对 对 方 已 经 
加 锁 的 字 节 加 锁 。 在 该 程序 中 使 用 了 8.9 广 中 介绍 的 父 进 程 和 子 进程 同 


步 例 程 (TELL xxx 和 WAIT xxx) ， 以 便 每 个 进程 能 够 


程 获得 它 设置 的 第 一 把 锁 。 


#include "apue .hy" 
#include «fcntl.h» 


static void 
lockabyte(const char *name, int fd, off t offset) 
{ 
if (writew_lock(fd, offset, SEEK_SET, 1) < 0) 
err sys("$s: writew lock error", name); 
printf("%s: got the lock, byte %lld\n", name, 


int 
main(void) 


( 


int fd; 

pid t pid; 

/* 
* Create a file and write two bytes to it. 
ic 


if ((fd = creat("templock", FILE MODE)) « 0) 
err sys("creat error"); 

if (write(fd, "ab", 2) != 2) 
err sys("write error"); 


TELL WAIT(); 
if ((pid = fork()) « 0) ( 
err sys("fork error"); 
} else if (pid == 0) { [*: iehild +y 
lockabyte("child", fd, 0); 
TELL PARENT (getppid()); 
WAIT PARENT(); 
lockabyte("child", fd, 1); 
) else ( /* parent */ 
lockabyte ("parent", fd, 1); 
TELL CHILD (pid); 
WAIT CHILD(); 
lockabyte "parent", fd, 0); 


} 
exit (0); 


运行 图 14-7 中 的 程序 得 到 : 


(long long)offset); 


图 14-7 死 锁 检测 实例 


$ /a.out 

parent: got the lock, byte 1 

child: got the lock, byte 0 

parent: writew lock error: Resource deadlock avoided 

child: got the lock, byte 1 

仿 测 到 死 锁 时 ， 内 核 必须 选择 一 个 进程 接收 出 错 返 回 。 在 本 实例 
中 ， 选 择 了 父 进程 ， 但 这 是 一 个 实现 细节 。 在 某 些 系统 上 ， 子 进程 总 
是 接 到 出 错 信息 ， 在 男 一 些 系 统 上 ， 父 进程 总 是 接 到 出 错 信 息 。 在 某 
些 系统 上 ， 当 试图 使 用 多 把 锁 时 ， 有 时 是 子 进 程 接 到 出 错 信 息 ， 有 了 时 
则 是 父 进程 接 到 出 错 信 筷 。 

3. 锁 的 隐 含 继承 和 释放 

天 于 记录 锁 的 目 动 继承 和 释放 有 3 条 规则 。 

(1) 锁 与 进程 和 文件 两 者 相关 联 。 这 有 两 重 含义 : 第 一 重 很 明 

显 ， 当 一 个 进程 终止 时 ， 它 所 建立 的 锁 全 部 释放 ; 第 二 重 则 不 太 明 
显 ， 无 论 一 个 描述 符 何 时 关闭 ， 该 进程 通过 这 一 描述 符 引 用 的 文件 上 
的 任何 一 把 锁 都 会 释放 〈 这 些 锁 都 是 该 进程 设置 的 ) 。 这 就 意味 着 ， 
如 果 执 行 下 列 4 步 : 

fd1 = open(pathname, ...); 

read lock(fd1, ...); 

fd2 = dup(fd1); 

close(fd2); 
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open， 其 效 采 也 一 样 : 

fd1 = open(pathname, ...); 

read lock(fd1, ...); 

fd2 = open(pathname, ...) 

close(fd2); 


(2) 由 fork 产 生 的 子 进程 不 继承 父 进程 所 设置 的 锁 。 这 意味 着 ， 
若 一 个 进程 得 到 一 把 锁 ， 然 后 调用 forkk， 那 么 对 于 父 进程 获得 的 锁 而 
言 ， 子 进程 被 视 为 另 一 个 进程 。 对 于 通过 fork 从 父 进程 处 继承 过 来 的 
描述 符 ， 子 进程 需要 调用 fcnt 才能 获得 它 目 己 的 锁 。 这 个 约束 是 有 道 
理 的 ， 因 为 锁 的 作用 是 阻止 多 个 进程 同时 写 同 一 个 文件 。 如 果子 进程 
通过 fork 继 承 父 进程 的 锁 ， 则 父 进程 和 子 进程 束 可 以 同时 写 同 一 个 文 
人 


(3) 在 执行 exec 后 ， 新 程序 可 以 继承 原 执行 程序 的 锁 。 但 是 注 
意 ， 如 果 对 一 个 文件 描述 符 设 置 了 执行 时 关闭 标志 ， 那 么 当 作为 exec 的 
一 部 分 关闭 该 文件 描述 符 时 ， 将 释放 相应 文件 的 所 有 锁 。 
4. FreeBSD 实 现 
完 休 要 地 观察 FreeBSD 实 现 中 使 用 的 数据 结构 。 这 会 帮助 我 们 进 一 
步 理 解 记 录 锁 的 目 动 继承 和 释放 的 第 一 条 规则 : 锁 与 进程 和 文件 两 者 
相关 联 。 
考虑 一 个 进程 ， 它 执行 下 列 语句 (忽略 出 错 返 回 ) 。 
fd1 = open(pathname, ...); 
write lock(fd1, 0, SEEK. SET, 1); /* parent write locks byte 0 */ 
if ((pid = fork()) > 0) { /* parent */ 
fd2 = dup(fd1); 
fd3 = open(pathname, ...); 
} else if (pid == 0) { 
read_lock(fd1, 1, SEEK_SET, 1); /* child read locks byte 1 */ 
} 
pause(); 


图 14-8 显 示 了 父 进 程 和 子 进程 暂停 (执行 pause0) 后 的 数据 结构 情 
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lock owner 指针 


struct lock owner 


所 有 者 信息 所 有 者 信息 
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图 14-8 关于 记录 锁 的 FreeBSD 数 据 结构 


前 面 已 经 给 出 了 open、fork 以 及 dup 调 用 后 的 数据 结构 ( 见 图 3-9 和 
图 8-2) 。 有 了 记录 锁 后 ， 在 原来 的 这 些 图 上 新 加 了 lockf 结 构 ， 它 们 由 i 
万 点 结构 开始 相互 链接 起 来 。 每 个 lockf 结 构 描 述 了 一 个 给 定 进 程 的 一 
个 加 锁 区 域 (由 偏 移 量 和 长 度 定义 的 ) 。 图 中 显示 了 两 个 lockf 结 构 ， 
一 个 是 由 父 进 程 调 用 write_lock 形 成 的 ， 男 一 个 则 是 由 子 进 程 调用 
read_lock 形 成 的 。 每 一 个 结构 都 包含 了 相应 的 进程 ID 。 


在 父 进程 中 ， 关 闭 fd1、fd2 或 ft3 中 的 任意 一 个 都 将 释放 由 父 进程 
设置 的 写 锁 。 在 关闭 这 3 个 描述 符 中 的 任意 一 个 时 ， 内 核 会 从 该 描述 符 
所 关联 的 节点 开始 ， 逐 个 检查 lockf 链 接 表 中 的 各 项 ， 并 释放 由 调用 进 
程 持 有 的 各 把 锁 。 内 核 并 不 清楚 (也 不 关心 ) 父 进程 是 用 这 3 个 描述 中 
的 哪 一 个 来 设置 这 把 锁 的 。 

实例 

在 图 13-6 所 示 的 程序 中 ， 我 们 了 解 到 ， 和 守护 进程 可 用 一 把 文件 锁 来 
保证 只 有 该 守护 进程 的 唯一 副本 在 运行 。 图 14-9 展 示 了 lockfile 芳 数 的 
实现 ， 守 护 进程 可 用 该 男 数 在 文件 上 加 写 锁 。 


#include <unistd.h> 
#include «fcntl.h» 


int 
lockfile(int fd) 
{ 
struct Elock Elz 


fl.l type = F WRLCK; 

fl.l start = 0; 

fl.l whence = SEEK SET; 

fl.l len = 0; 

return(fcntl(fd, F SETLK, &f1)); 


图 14-9 在 文件 整体 上 加 一 把 写 锁 

男 一 种 方法 是 用 write_lock 函 数 定义 lockfile 范 数 。 

#define lockfile(fd) write lock((fd), 0, SEEK. SET, 0) 

5. 在 文件 尾 端 加 锁 

在 对 相对 于 文件 尾 端的 字 节 范围 加 锁 或 解锁 时 需要 特别 小 心 。 大 
多 数 实现 按照 1 whence 的 SEEK_CUR 或 SEEK_END 值 ， 用 1]_start 以 及 文 
件 当前 位 置 或 当前 长 度 得 到 绝对 文件 偏 移 量 。 但 是 ， 和 常常 需要 相对 于 
文件 的 当前 长 度 指定 一 把 锁 ， 但 又 不 能 调用 fstat 来 得 到 当前 文件 长 度 ， 
因为 我 们 在 该 文件 上 没有 锁 。 (在 fstat 和 锁 调用 之 间 ， 可 能 会 有 男 一 
个 进程 改变 该 文件 长 度 。) 


考虑 以 下 代码 序列 : 

writew lock(fd, 0, SEEK. END, 0); 

write(fd, buf, 1); 

un lock(fd, 0, SEEK END); 

write(fd, buf, 1); 

该 代码 序列 所 做 的 可 能 并 不 是 你 所 期 望 的 。 它 得 到 一 把 写 锁 ， 该 
写 锁 从 当前 文件 尾 闯 起 ， 包 括 以 后 可 能 追加 写 到 该 文件 的 任何 数据 。 
假定 ， 该 文件 偏 移 量 处 于 文件 尾 端 时 ， 执 行 第 一 个 write， 这 个 操作 将 
文件 延伸 了 1 个 字 节 ， 而 该 字 万 将 被 加 锁 。 跟 随 其 后 的 是 解锁 操作 ， 其 
作用 是 对 以 后 追加 写 到 文件 上 的 数据 不 再 加 锁 。 但 在 其 之 前 刚 妃 加 写 
的 一 个 字 市 则 保留 加 锁 状 态 。 当 执行 第 二 个 写 时 ， 文 件 尾 端 又 延 促 了 1 
个 字 节 ， 但 该 字 世 并 未 加 锁 。 由 此 代码 序列 造成 的 文件 锁 状 态 如 图 14- 
10 所 示 。 
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图 14-10 文件 区 域 锁 


当 对 文件 的 一 部 分 加 锁 时 ， 内 核 将 指定 的 偏 移 量 变换 成 绝对 文件 
偏 移 量 。 男 外 ， 除 了 指定 一 个 绝对 偏 移 量 (SEEK SET) 之 外 ，fcntl 还 
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& (SEEK CUR) 或 文件 尾 端 (SEEK END) 。 当 前 偏 移 量 和 文件 尾 
端 可 能 会 不 断 变化 ， 而 这 种 变化 又 不 应 影响 现 有 锁 的 状态 ， 所 以 内 核 
必须 独立 于 当前 文件 偏 移 量 或 文件 尾 端 而 记 住 锁 。 

如 果 想 解除 的 锁 中 包括 第 一 次 write APSA SF, ARAM TEE 
长 度 为 -1。 负 的 长 度 值 表示 在 指定 偏 移 量 之 前 的 字 节 数 。 

6. 建议 性 锁 和 强制 性 锁 

考虑 数据 库 访问 例 程 库 。 如 果 该 库 中 所 有 函数 都 以 一 致 的 方法 处 
理 记录 锁 ， 则 称 使 用 这 些 函 数 访 问 数 据 库 的 进程 集 为 合作 进程 

(cooperating process) 。 如 果 这 些 函 数 是 唯一 地 用 来 访问 数据 库 的 画 

数 ， 那 么 它们 使 用 建议 性 锁 是 可 行 的 。 但 是 建议 性 锁 并 不 能 阻止 对 数 
据 库 文件 有 写 权 限 的 任何 其 他 进程 写 这 个 数据 库 文件 。 不 使 用 数据 库 
访问 例 程 库 协 同一 致 的 方法 来 访问 数据 库 的 进程 是 非 合 作 进 程 。 

强制 性 锁 会 让 内 核 检查 每 一 个 open ^ read 和 write， 验 证 调用 进程 
是 否 违 背 了 正在 访问 的 文件 上 的 某 一 把 锁 。 强 制 性 锁 有 时 也 称 为 强迫 
方式 锁 (enforcement-mode locking) ° 

从 图 14-2 中 可 以 看 出 ，Linux 3.2.0 和 Solaris 10 提 供 强 制 性 记录 锁 ， 
而 FreeBSD 8.0 和 Mac OS X 10.6.8 则 不 提供 。 强 制 性 记录 锁 不 是 Single 
UNIX Specification 的 组 成 部 分 。 在 Linux 中 ， 如 果 用 户 想 要 使 用 强制 性 
锁 ， 则 需要 在 各 个 文件 系统 基础 上 用 mount 命 令 的 -o mand 选 项 来 打开 该 
机 制 。 

对 一 个 特定 文件 打开 其 设置 组 ID 位 、 关 闭 其 组 执行 位 便 开 局 了 对 
该 文件 的 强制 性 锁 机 制 (回忆 图 4-12) 。 因 为 当 组 执行 位 关闭 时 ， 设 置 
组 ID 位 不 再 有 意义 ， 所 以 SVR3 的 设计 者 借用 两 者 的 这 种 组 合 来 指定 对 
一 个 文件 的 锁 是 强制 性 的 而 非 建议 性 的 。 

如 果 一 个 进程 试图 读 (read) 或 写 (write) 一 个 强制 性 锁 起 作用 的 
文件 ， 而 欲 读 、 写 的 部 分 又 由 其 他 进程 加 上 了 锁 ， 此 时 会 发 生 什 么 


呢 ?” 对 这 一 问题 的 回答 取决 于 3 方面 的 因素 : 操作 类 型 (read gy 
write) 、 其 他 进程 持 有 的 锁 的 类 型 ( 读 锁 或 写 锁 ) 以 及 read 或 write 的 描 
述 符 是 阻塞 还 是 非 阻 塞 的 。 图 14-11 列 出 了 8 种 可 能 性 。 


其 他 进程 在 该 区 域 上 阻塞 描述 符 非 阻塞 描述 符 


g 现 有 锁 的 类 型 
NEUES 


图 14-11 强制 性 锁 对 其 他 进程 的 read 和 write 的 影响 


除了 图 14-11 中 的 read 和 write 芳 数 ， 男 一 个 进程 持 有 的 强制 性 锁 也 
会 对 open 函 数 产 生 影响 。 通 遂 ， 即 使 正在 打开 的 文件 具有 强制 性 记录 
鲍 ， 该 open 也 会 成 功 。 随 后 的 read 或 write 依 从 于 图 14-11 中 所 示 的 规 
则 。 但 是 ， 如 果 欲 打开 的 文件 具有 强制 性 记录 锁 〈 读 锁 或 写 锁 ) ， 而 
且 open 调 用 中 的 标志 指定 为 O_TRUNC 或 O CREAT， 则 不 论 是 否 指定 
O_NONBLOCK，open 都 立即 出 错 返 回 ，errno 设 置 为 EAGAIN。 

只 有 Solaris 对 O_CREAT 标 志 人 处 理 为 出 错 。 当 打开 一 个 具 强 制 性 锁 
的 文件 时 ，Linux 人 允许 指定 O_CREAT 标 志 。 对 O_TRUNC 标 志 产 生 open 
出 错 是 有 意义 的 ， 因 为 对 于 一 个 文件 来 讲 ， 若 男 一 个 进程 持 有 它 的 读 
锁 或 写 锁 ， 那 么 它 就 不 能 被 截 短 为 0。 但 是 对 O_CREAT 标 志 在 返回 时 
设置 出 错 就 没什么 意义 了 ， 因 为 该 标志 表示 ， 只 有 在 该 文件 不 存在 时 
才 创建 ， 但 由 于 另 一 个 进程 持 有 该 文件 的 记录 锁 ， 所 以 该 文件 肯定 是 
存在 的 。 

这 种 open 的 锁 剖 突 处 理 方 式 可 能 会 导致 令 人 惊异 的 结果 。 在 开发 
本 市 习题 的 时 候 ， 我 们 曾 编写 过 一 个 测试 程序 ， 它 打开 一 个 文件 (其 
模式 指定 为 强制 性 锁 ) ， 对 该 文件 整体 设置 一 把 读 锁 ， 然 后 休眠 一 段 
时 间 。 (回忆 图 14-11， 读 锁 应 当 阻 止 其 他 进程 写 该 文件 。) 在 这 段 休 


眠 时 间 内 ， 用 某 些 典型 的 UNIX 系 统 程序 和 操作 符 对 该 文件 进行 处 理 ， 
发 现下 列 情 况 。 

“可 用 ed 编辑 器 对 该 文件 进行 编辑 操作 ， 而 且 编 辑 结 果 可 以 写 回 人 磁 
AE! 强制 性 记录 锁 根 本 不 起 作用 。 用 某 些 UNIX 系 统 版 本 提供 的 系统 调 
用 跟踪 特性， 对 ed 操作 进行 跟 踩 分 析 发 现 ，ed 将 新 内 容 写 到 一 个 临时 
文件 中 ， 然 后 删除 原文 件 ， 最 后 将 临时 文件 名 改 为 原文 件 名 。 强 制 性 
锁 机 制 对 unlink 函 数 没有 影响 ， 于 是 这 一 切 束 发 生 了 。 

在 FreeBSD 8.0 和 Solaris 10 中 ， 用 truss(1) 命 令 可 以 得 到 一 个 进程 的 
系统 调用 跟踪 信息 。Linux 3.2.0 出 于 相同 的 目的 提供 了 strace(1) 命 令 。 
Mac OS X 10.6.8 提 供 了 dtruss(1m) 命 令 来 追踪 系统 调用 ， 但 该 命令 的 使 
用 需要 超级 用 户 的 权限 。 

.不 能 用 vi 编辑 器 编辑 该 文件 。vi 可 以 读 该 文件 的 内 容 ， 但 是 如 果 
试图 将 新 的 数据 写 到 该 文件 中 ， 就 会 出 错 返 回 (EAGAIN) 。 如 果 试 图 
将 新 数据 追加 写 到 该 文件 中 ， 则 write 阻塞 。vi 的 这 种 行为 与 我 们 所 希 
望 的 一 样 。 

“使 用 Kor shell 的 > 和 >> 控 作 符 重 写 或 退 加 写 该 文件 ， 会 产生 出 误 
信息 “cannot create”。 

“在 Bourne shell 下 使 用 > 操作 人 符 也 会 出 错 ， 但 是 使 用 >> 操 作 符 时 只 
阻塞 ， 在 解除 强制 性 锁 后 会 继续 进行 处 理 。 (这 两 种 shell 在 执行 追加 
写 操作 时 之 所 以 会 产生 的 差异 ， 是 因为 Korn shell 以 O_CREAT 和 
O_APPEND 标 志 打 开 文 件 ， 而 上 面 已 提 及 指定 O_CREAT 会 产生 出 错 返 
回 。 但 是 ， Bourne shell 在 该 文件 已 存在 时 并 不 指定 O CREAT， 所 以 
open 成 功 ， 而 下 一 个 write 则 阻塞 。) 产生 的 结果 随 所 用 操作 系统 版 本 
的 不 同 而 不 同 。 从 这 样 一 个 习题 中 可 见 ， 在 使 用 强制 性 锁 时 还 需 有 所 
警惕 。 从 ed 实例 可 以 看 到 ， 强 制 性 锁 是 可 以 设法 避 开 的 。 

一 个 恶意 用 户 可 以 使 用 强制 性 记录 锁 ， 对 大 家 都 可 读 的 文件 加 一 
把 读 锁 ， 这 样 束 能 阻止 任何 人 写 该 文件 (当然 ， 该 文件 应 当 是 强制 性 


锁 机 制 起 作用 的 ， 这 可 能 要 求 该 用 户 能 够 更 改 该 文件 的 权限 位 ) 。 考 
虑 一 个 数据 库 文件 ， 它 是 大 家 都 可 读 的 ， 并 且 是 强制 性 锁 机 制 起 作用 
的 。 如 有 果 一 个 恶意 用 户 要 对 整个 这 个 文件 持 有 一 把 读 锁 ， 其 他 进程 束 
不 能 再 写 该 文件 。 

实例 

图 14-12 中 的 程序 可 以 用 于 确定 一 个 系统 是 否 文 持 强 制 性 锁 机 制 。 


#include "apue.h" 
#include <errno.h> 
#include «fcntl.h» 
#include <sys/wait.h> 


int 
main(int argc, char *argv[]) 


{ 


int fd; 
pid_t pid; 
char but [Se 
struct stat statbuf; 


if (arge != 2) { 
fprintf(stderr, "usage: %s filename\n", argv[0]); 


exit(1); 


if ((fd = open(argv[1], O_RDWR | O CREAT | O TRUNC, FILE MODE)) < 0) 
err sys("open error"); 

if (write(fd, "abcdef", 6) !- 6) 
err sys("write error"); 


/* turn on set-group-ID and turn off group-execute */ 

if (fstat(fd, &statbuf) « 0) 
err sys("fstat error"); 

if (fchmod(fd, (statbuf.st mode & ~S_IXGRP) | S ISGID) « 0) 
err sys("fchmod error"); 


TELL WAIT(); 


if ((pid = fork()) < 0) ( 
err sys("fork error"); 
) else if (pid > 0) ( /* parent */ 
/* write lock entire file */ 
if (write lock(fd, 0, SEEK SET, 0) « 0) 
err sys("write lock error"); 


TELL CHILD (pid) ; 
if (waitpid(pid, NULL, 0) < 0) 
err sys("waitpid error"); 
) eise ( /* child */ 
WAIT PARENT () ; /* wait for parent to set lock */ 


set fl(fd, O NONBLOCK); 


/* first let's see what error we get if region is locked */ 
if (read lock(fd, 0, SEEK SET, 0) !- -1) /* no wait */ 


err sys("child: read lock succeeded"); 
printf("read lock of already-locked region returns %d\n", 
errno); 


/* now try to read the mandatory locked file */ 
if (lseek(fd, 0, SEEK SET) -- -1) 
err sys("lseek error"); 
if (read(fd, buf, 2) < 0) 
err ret("read failed (mandatory locking works)"); 
else 
printf("read OK (no mandatory locking), buf = $2.2sMn", 
but); 


exit (0); 


E 14-12 确定 是 否 支持 强制 性 锁 

此 程序 首先 创建 一 个 文件 ， 并 使 强制 性 锁 机 制 对 其 起 作用 。 人 然后 
程序 分 出 一 个 父 进 程 和 一 个 子 进程 。 父 进程 对 整个 文件 设置 一 把 写 
锁 ， 子 进程 则 先 将 该 文件 的 描述 符 设 置 为 非 阻塞 的 ， 然 后 企图 对 该 文 
件 设置 一 把 读 锁 ， 我 们 期 望 这 会 出 错 返 回 ， 并 希望 看 到 系统 返回 是 
EACCES 或 EAGAIN。 接 着 ， 子 进程 将 文件 读 、 写 位 置 调 整 到 文件 起 
点 ， 并 试图 读 (read) 该 文件 。 如 果 系 统 提供 强制 性 锁 机 制 ， 则 read 
应 返回 EACCES 或 EAGAIN (因为 该 描述 符 是 非 阻 塞 的 ) ， 和 否则 read 
返回 所 读 的 数据 。 在 Solaris 10 上 运行 此 程序 (该 系统 支持 强制 性 锁 机 
制 ) ， 得 到 : 


$ /a.out temp.lock 


read lock of already-locked region returns 11 

read failed (mandatory locking works): Resource temporarily 
unavailable 

查看 系统 头 文 件 或 intro(2) 手 册页 ， 可 以 看 到 ermo 值 11 对 应 于 
EAGAIN。 若 在 FreeBSD 8.0 运 行 此 程序 ， 则 得 到 |: 

$ /a.out temp.lock 


read lock of already. locked region returns 35 


read OK (no mandatory locking), buf = ab 

其 中 ，errno 值 35 对 应 于 EAGAIN。 该 系统 不 支持 强制 性 锁 。 

实例 

让 我 们 回 到 本 市 的 第 一 个 问题 ， 当 两 个 人 同时 编辑 同一 个 文件 时 
将 会 怎样 呢 ? 一 般 的 UNIX 系 统 文本 编辑 器 并 不 使 用 记录 锁 ， 所 以 对 此 
问题 的 回答 仍然 是 : 该 文件 的 最 后 结果 取决 于 写 该 文件 的 最 后 一 个 进 
程 。 

某 些 版 本 的 vi 编辑 器 使 用 建议 性 记录 锁 。 即 使 我 们 使 用 这 种 版 本 的 
vi 编辑 器 ， 它 仍然 不 能 阻止 其 他 用 户 使 用 另 一 个 没有 使 用 建议 性 记录 锁 
的 编辑 合 。 

右 系 统 提供 强制 性 记录 锁 ， 那 么 我 们 可 以 修改 目 己 第 用 的 编辑 人 大 
来 使 用 它 (如 果 我 们 有 该 编辑 器 的 源 代码 ) 。 如 果 没 有 该 编辑 器 的 源 
代码 ， 那 么 可 以 试 一 试 下 述 方法 。 编 写 一 个 vi 的 前 端 程序 。 该 程序 立即 
调用 fork， 然 后 父 进程 只 等 待 子 进程 完成 。 子 进程 打开 在 命令 行 中 指定 
的 文件 ， 使 强制 性 锁 起 作用 ， 对 整个 文件 设置 一 把 写 锁 ， 然 后 执行 vi。 
在 Vi 运行 时 ， 该 文件 是 加 了 写 锁 的 ， 所 以 其 他 用 户 不 能 修改 它 。 当 vi 结 
束 时 ， 父 进程 从 wait 返 回 ， 目 编 的 前 端 程序 结束 。 

虽然 可 以 编写 这 种 类 型 的 小 型 前 端 程序 ， 但 它 却 不 起 作用 。 问 题 
出 在 大 多 数 编辑 右 读 它们 的 输入 文件 ， 然 后 关闭 它 。 只 要 引用 被 编辑 
文件 的 描述 符 关 闭 了 ， 那 么 加 在 该 文件 上 的 锁 吉 被 释放 了 。 这 意味 
着 ， 在 编辑 器 读 了 该 文件 的 内 容 后 ， 随 即 关 闭 了 该 文件 ， 那 么 锁 也 束 
不 存在 了 。 这 个 前 端 程序 中 没有 任何 方法 可 以 阻止 这 一 点 。 

在 第 20 章 中 ， 我 们 将 使 用 数据 库 函 数 库 中 的 记录 锁 来 提供 多 个 进 
程 的 并 发 访问 。 我 们 还 将 提供 一 些 时 间 测 量 ， 以 观察 记录 锁 对 进程 的 


影响 。 


14.4 VO £ BRE 


SAAR, REX SRA Mama, n DATE Ra 
式 的 人 循环 中 使 用 阻塞 1/O: 

while ((n=read(STDIN_FILENO, buf, BUFSIZ)) > 0) 

if (write((STDOUT. FILENO, buf, n) !- n) 
err sys("write error"); 

这 种 形式 的 阻塞 UO 到 处 可 见 。 但 是 如 果 必 须 从 两 个 描述 符 读 ， 又 

将 如 何 呢 ? 在 这 种 情况 下 ， 我 们 不 能 在 任 一 个 描述 符 上 进行 阻塞 读 
(read) ， 否 则 可 能 会 因为 被 阻塞 在 一 个 描述 符 的 读 操 作 上 而 导致 另 一 

个 描述 符 即 使 有 数据 也 无 法 处 理 。 所 以 为 了 处 理 这 种 情况 需要 另 一 种 
不 同 的 技术 。 

让 我 们 观察 telnet(1) 命 令 的 结构 。 该 程序 从 终端 (标准 输入 ) BE, 
将 所 得 数据 写 到 网 络 连 接 上 ， 同 时 从 网 络 连接 读 ， 将 所 得 数据 写 到 终 
端 上 (标准 输出 ) 。 在 网 络 连接 的 另 一 端 ，telnetd 守 护 进 程 读 用 户 键入 
的 命令 ， 并 将 所 读 到 的 送 给 shell， 这 如 同 用 户 登 录 到 远程 机 器 上 一 
样 。telnetd 守护 进程 将 执行 用 户 键入 命令 而 产生 的 输出 通过 telnet 命令 
送 回 给 用 户 ， 并 显示 在 用 户 终端 上 。 图 14-13 显 示 了 这 种 工作 情景 。 


终端 上 telnet telnetd 
的 用 户 命令 守护 进程 


图 14-13 telnet 程 序 概观 
telnet 进程 有 两 个 输入 ， 两 个 输出 。 我 们 不 能 对 两 个 输入 中 的 任 一 
个 使 用 阻塞 read， 因 为 我 们 不 知道 到 搬 哪 一 个 输入 会 得 到 数据 。 


处 理 这 种 特殊 问题 的 一 种 方法 是 ， 将 一 个 进程 变 成 两 个 进程 (用 
fork) ， 每 个 进程 处 理 一 条 数据 通路 。 图 14-14 中 显示 了 这 种 安排 。 
(System V 的 uucp 通 信 包 提供 了 cu(1) 命 令 ， 其 结构 与 此 相似 。) 


telnet 命令 
〈 父 进程 ) 
终端 上 telnetd 
的 用 户 守护 进程 
telnet 命令 


图 14-14 使 用 两 个 进程 实现 telnet 程 序 

如 果 使 用 两 个 进程 ， 则 可 使 每 个 进程 都 执行 阻塞 read。 但 是 这 也 产 
生 了 问题 : 操作 什么 时 候 终 止 ? 如 果子 进程 接收 到 文件 结束 符 (telnetd 
守护 进程 使 网 络 连接 断 开 ) ， 那 么 该 子 进程 终止 ， 然 后 父 进程 接收 到 
SIGCHLD 信和 号。 但 是 ， 如 果 父 进程 终止 (用户 在 终端 上 键入 了 文件 结 
RIF) ， 那 么 父 进程 应 通知 子 进 程 停止 。 为 此 可 以 使 用 一 个 信号 (如 
SIGUSR1) ， 但 这 使 程序 变 得 更 加 复杂 。 

我 们 可 以 不 使 用 两 个 进程 ， 而 是 用 一 个 进程 中 的 两 个 线程 。 虽 然 
这 避免 了 终止 的 复杂 性 ， 但 却 要 求 处 理 两 个 线程 之 间 的 同步 ， 在 复杂 
性 方面 这 可 能 会 得 不 偿 失 。 

另 一 个 方法 是 仍旧 使 用 一 个 进程 执行 该 程序 ， 但 使 用 非 阻塞 IO 读 
取 数 据 。 其 基本 思想 是 : 将 两 个 输入 描述 符 都 设置 为 非 阻 塞 的 ， 对 第 
一 个 描述 符 发 一 个 read。 如 有 果 该 输入 上 有 数据 ， 则 读数 据 并 处 理 它 。 
如 有 果 无 数据 可 读 ， 则 该 调用 立即 返回 。 然 后 对 第 二 个 描述 符 作 同样 的 
处 理 。 在 此 之 后 ， 等 待 一 定 的 时 间 (可 能 是 若干 秒 ) ， 然 后 再 尝试 从 
第 一 个 描述 符 读 。 这 种 形式 的 循环 称 为 轮 询 。 这 种 方法 的 不 足 之 处 是 
浪费 CPU 时 间 。 大 多 数 时 间 实 际 上 是 无 数据 可 读 ， 因 此 执行 read 系 统 调 
用 浪费 了 时 间 。 在 每 次 循环 后 要 等 多 长 时 间 再 执行 下 一 轮 循环 也 很 难 


确定 。 虽 然 轮 询 技术 在 支持 非 阻塞 UVO 的 所 有 系统 上 都 可 使 用 ， 但 是 在 
多 任务 系统 中 应 当 避 免 使 用 这 种 方法 。 

还 有 一 种 技术 称 为 异步 WO (asynchronous IO) 。 利 用 这 种 技术 ， 
进程 告诉 内 核 ， 当 描述 符 准备 好 可 以 进行 WO 时 ， 用 一 个 信号 通知 它 。 
这 种 技术 有 两 个 问题 。 首 先 ， 尽 管 一 些 系 统 提 供 了 各 自 的 受 限 形式 的 
异步 0， 但 POSIX 采 纳 了 另外 一 套 标准 化 接口 ， 所 以 可 移植 性 成 为 一 
个 问题 (以 前 ，POSIX 异 步 /O 是 Single UNIX Specification 中 是 可 选 设 
施 ， 但 现在 ， 这 些 接口 在 SUSv4 中 是 必需 的 ) System V 提供 了 
SIGPOLL 信号 来 支持 受 限 形式 的 异步 TO， 但 是 仅 当 描述 符 引 用 
STREAMS 设 备 时 ， 此 信号 才 起 作用 。BSD 有 一 个 类 似 的 信号 SIGIO， 
但 也 有 类 似 的 限制 : 仅 当 描述 符 引 用 终端 设备 或 网 络 时 它 才 能 起 作 
用 。 

这 种 技术 的 第 二 个 问题 是 ， 这 种 信号 对 每 个 进程 而 言 只 有 1 个 

(SIGPOLL 或 SIGIO) 。 如 果 使 该 信号 对 两 个 描述 符 都 起 作用 (在 我 们 
正在 讨论 的 实例 中 ， 从 两 个 描述 符 读 ) ， 那 么 进程 在 接 到 此 信号 时 将 
无 法 判别 是 哪 一 个 描述 符 准备 好 了 。 尽 管 POSIX.1 异 步 /O 接 口 允 许 选 
择 哪个 信号 作为 通知 ， 但 能 用 的 信号 数量 仍 远 小 于 潜在 的 打开 文件 描 
述 符 的 数量 。 为 了 确定 是 哪 一 个 描述 符 准 备 好 了 ， 仍 需 将 这 两 个 描述 
符 都 设置 为 非 阻塞 的 ， 并 顺序 尝试 执行 WO。 我 们 将 在 14.5 节 讨论 异步 
I/O ° 

一 种 比较 好 的 技术 是 使 用 1/O 多 路 转 接 (1/O multiplexing) ° AS 
使 用 这 种 技术 ， 先 构造 一 张 我 们 感 兴趣 的 描述 符 (通常 都 不 止 一 个 ) 
的 列表 ， 然 后 调用 一 个 函数 ， 直 到 这 些 描述 符 中 的 一 个 已 准备 好 进行 
IO 时 ， 该 函数 才 返 回 。poll、pselect 和 select 文 3 个 函数 使 我 们 能 够 执行 
IO 多 路 转 接 。 在 从 这 些 函 数 返 回 时 ， 进 程 会 被 告知 哪些 描述 符 已 准备 
好 可 以 进行 WO。 


POSIX 指 定 ， 为 了 在 程序 中 使 用 select， 必 须 包 括 <sys/selecth>。 但 
较 老 的 系统 还 要 求 包括 <sys/types.h>、<sys/time.h> 和 <unistd.h>。 查 看 
select 手 册页 可 以 弄 清 楚 你 的 系统 都 支持 什么 。 

IO 多 路 转 接 在 4.2BSD 中 是 用 select 函 数 提供 的 。 虽 然 该 函数 主要 用 
于 终端 WO 和 网 络 WO， 但 它 对 其 他 摘 述 和 从 同样 是 起 作用 的 。SVR3 在 增 
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STREAMS 设 备 起 作用 。SVR4 支 持 对 任意 描述 符 起 作用 的 poll 。 


14.4.1 函数 select 和 pselect 


在 所 有 POSIX 兼 容 的 平台 上 ，select 函 数 使 我 们 可 以 执行 1O 多 路 转 
接 。 传 给 select 的 参数 告诉 内 核 : 

"我 们 所 关心 的 摘 述 符 ; 

对 于 每 个 描述 符 我 们 所 关心 的 条 件 (是 否 想 从 一 个 给 定 的 描述 符 
读 ， 是 否 想 写 一 个 给 定 的 摘 述 符 ， 是 否 关 心 一 个 给 定 描述 符 的 异常 条 
件 ) ; 

"愿意 等 待 多 长 时 间 〈 可 以 永远 等 待 、 等 待 一 个 固定 的 时 间或 者 根 
本 不 等 待 ) 。 

从 select 返 回 时 ， 内 核 告诉 我 们 : 

"已 准备 好 的 摘 述 符 的 总 数量 ; 

"对 于 恋 、 写 或 异常 这 3 个 条 件 中 的 每 一 个 ， 哪 些 摘 述 符 已 准备 好 。 

使 用 这 种 返回 信息 ， 就 可 调用 相应 的 VO 函数 (一 般 是 read 或 
write) ， 并 且 确 知 该 函数 不 会 阻塞 。 


#include <sys/select.h> 


int select(int maxfdp1, fd_set *restrict readfds, 
fd_set *restrict writefds, fd_set *restrict exceptfds, 


struct timeval *restrict tvptr); 


返回 值 : Ea LRM A; RAY, GIO; its, e- 

先 来 说 明 最 后 一 个 参数 ， 它 指定 愿意 等 待 的 时 间 长 度 ， 单 位 为 秒 
和 微 秒 (回忆 4.20 节 ) 。 有 以 下 3 种 情况 。 

tvptr == NULL 

永远 等 待 。 如 采 捕 捉 到 一 个 信号 则 中 断 此 无 限期 等 待 。 当 所 指定 
的 描述 符 中 的 一 个 已 准备 好 或 捕捉 到 一 个 信号 则 返回 。 如 条 捕 捉 到 一 
个 信号 ， 则 select 返 回 -1，ermo 设 置 为 EINTR。 

tvptr-^tv sec == 0 && tvptr->tv_usec == 0 

根本 不 等 待 。 测 试 所 有 指定 的 描述 符 并 立即 返回 。 这 是 轮 询 系统 
找到 多 个 描述 符 状 态 而 不 阻塞 select 函 数 的 方法 。 

tvptr->tv_sec != 0 || tvptr->tv_usec != 0 

等 待 指定 的 秒 数 和 微 秒 数 。 当 指定 的 描述 符 之 一 已 准备 好 ， 或 当 
指定 的 时 间 值 已 经 超过 时 立即 返回 。 如 果 在 超时 到 期 时 还 没有 一 个 描 
述 符 准备 好 ， 则 返回 值 是 0。 (如 果 系 统 不 提供 微 秒 级 的 精度 ， 则 
tvptr->tv_usec 值 取 整 到 最 近 的 支持 值 。) 与 第 一 种 情况 一 样 ， 这 种 等 待 
可 被 捕捉 到 的 信号 中 断 。 

POSIX.1 人 允许 实现 修改 timeval 结 构 中 的 值 ， 所 以 在 select 返 回 后 ， 
你 不 能 指望 该 结构 仍旧 保持 调用 select 之 前 它 所 包含 的 值 。FreeBSD 
8.0 ` Mac OS X 10.6.8 和 Solaris 10 都 保持 该 结构 中 的 值 不 变 。 但 是 ,将 
在 超时 时 间 疝 未 到 期 时 ，select 吏 返回 ， 那 么 Linux 3.2.0 将 用 剩余 时 间 
值 更 新 该 结构 。 

中 间 3 个 参数 readfds、writefds 和 exceptfds 是 指 辐 描述 符 集 的 指针 。 
这 3 个 描述 符 集 说 明了 我 们 关心 的 可 读 、 可 写 或 处 于 异 贞 条 件 的 描述 符 
集合 。 每 个 描述 符 集 存储 在 一 个 fd_set 数 据 类 型 中 。 这 个 数据 类 型 是 由 
实现 选择 的 ， 它 可 以 为 每 一 个 可 能 的 描述 符 保 持 一 位 。 我 们 可 以 认为 
它 只 是 一 个 很 大 的 字 市 数组 ， 如 图 14-15 所 示 。 


fd0 fdl fd2 


Pls 
pe 


每 个 可 能 的 描述 符 一 个 位 


H4—————— fd set 数据 类 型 一 一 一 一 一 | 


图 14-15 对 select 指 定 读 、 写 和 异常 条 件 描述 符 

对 于 fd_set 数 据 类 型 ， 唯 一 可 以 进行 的 处 理 是 : 分 配 一 个 这 种 类 型 
的 变量 ， 将 这 种 类 型 的 一 个 变量 值 赋 给 同类 型 的 男 一 个 变量 ， 或 对 这 
种 类 型 的 变量 使 用 下 列 4 个 函数 中 的 一 个 。 

#include <sys/select.h> 

int FD ISSET(int fd, fd set *fdset); 

返回 值 : 者 fd 在 描述 符 集 中 ， 返 回 非 0 值 ; 否则 ， 返 回 0 

void FD. CLR(int fd, fd set *fdset); 

void FD. SET(int fd, fd set *fdset); 

void FD. ZERO(fd set *fdset); 
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有 位 设置 为 0。 要 开局 接 述 符 集 中 的 一 位 ， 可 以 调用 FD_SET。 调 用 
FD_CLR 可 以 清除 一 位 。 最 后 ， 可 以 调用 FD_ISSET 测 试 描述 符 集 中 的 
一 个 指定 位 是 否 已 打开 。 

在 声明 了 一 个 描述 符 集 之 后 ， 必 须 用 FD_ZERO 将 这 个 描述 符 集 置 
为 0， 然 后 在 其 中 设置 我 们 关心 的 各 个 描述 符 的 位 。 具 体操 作 如 下 所 


ZN: 


fd_set rset; 


int fd; 

FD. ZERO(&rset); 

FD SET(fd, &rset); 

FD SET(STDIN FILENO, &rset); 

从 select 返 回 时 ， 可 以 用 FD_ISSET 测 试 该 集中 的 一 个 给 定位 是 否 仍 
外 于 打开 状态 :: 

if (FD ISSET(fd, &rset)) { 

} 

select 的 中 间 3 个 参数 〈 指 向 描述 符 集 的 指针 ) 中 的 任意 一 个 (或 全 
部 ) 可 以 是 空 指针 ， 这 表示 对 相应 条 件 并 不 关心 。 如 果 所 有 3 个 指针 都 
是 NULL， 则 select 提 供 了 比 sleep 更 精确 的 定时 器。 — (I8 710.19 17, 
sleep 等 待 整 数秒 ， 而 select 的 等 待 时 间 则 可 以 小 于 1 秒 ， 其 实际 精度 取决 
于 系统 时 钟 。) 习题 14.5 给 出 了 这 样 一 个 函数 。 

select 第 一 个 参数 maxfdp1 的 意思 是 “最 大 文件 描述 符 编 号 值 加 1”。 
考虑 所 有 3 个 描述 符 集 ， 在 3 个 描述 符 集 中 找 出 最 大 描述 符 编 号 值 ， 然 
后 加 1， 这 就 是 第 一 个 参数 值 。 也 可 将 第 一 个 参数 设置 为 
FD_SETSIZE， 这 是 <sys/selecth> 中 的 一 个 常量 ， 它 指定 最 大 描述 符 数 

(经 常 是 1 024) ， 但 是 对 大 多 数 应 用 程序 而 言 ， 此 值 太 大 了 “。 确 实 ， 

大 多 数 应 用 程序 只 使 用 3 一 10 个 描述 符 〈 某 些 应 用 程序 需要 更 多 的 描述 
符 ， 但 这 种 UNIX 程 序 并 不 典型 ) 。 通 过 指定 我 们 所 关注 的 最 大 描述 
符 ， 内 核 束 只 需 在 此 范围 内 寻找 打开 的 位 ， 而 不 必 在 3 个 描述 符 集中 的 
数 百 个 没有 使 用 的 位 内 搜索 。 

例如 ， 图 14-16 所 示 的 两 个 描述 符 集 的 情况 融 好 像 是 执行 了 下 述 操 
VE: 

fd_set readset, writeset; 

FD ZERO(&readset); 


FD ZERO(&writeset); 

FD. SET(0, &readset); 

FD. SET(3, &readset); 

FD SET(1, &writeset); 

FD SET(2, &writeset); 

select(4, &readset, &writeset, NULL, NULL); 
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一 个 参数 实际 上 是 要 检查 的 描述 符 数 (从 描述 符 0 开始 ) 。 

select 有 3 个 可 能 的 返回 值 。 


fd0 fdl fd2 fd3 


readset: 1 0 0 1 


IGE 


一 一 > 这 以 后 的 位 都 没有 检查 
! MEN 


maxfdp1 = 4 


writeset: 


114-16 select 的 样本 描述 符 集 

(1) 返回 值 -1 表 示 出 错 。 这 是 可 能 发 生 的 ， 例 如 ， 在 所 指定 的 描 
述 符 一 个 者 没准 备 好 时 捕捉 到 一 个 信号 。 在 此 种 情况 下 ， 一 个 摘 述 符 
集 都 不 修改 。 

(2) 返回 值 0 表示 没有 描述 符 准备 好 。 若 指定 的 描述 符 一 个 都 没 
准备 好 ， 指 定 的 时 间 就 过 了 ， 那 么 束 会 发 生 这 种 情况 。 此 时 ， 所 有 摘 
述 符 集 都 会 置 0。 

(3) 一 个 正 返回 值 阅 明了 已 经 准备 好 的 描述 符 数 。 该 值 是 3 个 描 
述 符 集 中 已 准备 好 的 描述 符 数 之 和 ， 所 以 如 果 同 一 描述 符 已 准备 好 读 


和 写 ， 那 么 在 返回 值 中 会 对 其 计 两 次 数 。 在 这 种 情况 下 ， 3 个 描述 符 集 
中 仍旧 打开 的 位 对 应 于 已 准备 好 的 描述 符 。 

对 于 “准备 好 ”的 含义 要 作 一 些 更 具体 的 说 明 。 

WISE (readfds) 中 的 一 个 描述 符 进行 的 read 操 作 不 会 阻塞 ， 
则 认为 此 摘 述 符 是 准备 好 的 。 

Tas (writefds) 中 的 一 个 描述 符 进 行 的 write 操作 不 会 阻塞 ， 
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AT AIFS (exceptfds) 中 的 一 个 描述 符 有 一 个 未 决 异常 条 
件 ， 则 认为 此 描述 符 是 准备 好 的 。 现 在 ， 异 党 条件 包 括 : 在 网 络 连 接 
上 到 达 带 外 的 数据 ， 或 者 在 处 于 数据 包 模 式 的 伪 终 端 上 发 生 了 菜 些 条 
件 。 (Stevens[1990] 的 15.10 节 中 描述 了 后 一 种 条 件 。) 

"对 于 读 、 写 和 异常 条 件 ， 普 通 文件 的 文件 摘 述 符 总 是 返回 准备 
好 。 

一 个 摘 述 符 阻 堵 与 否 并 不 影响 select 是 否 阻塞 ， 理 解 这 一 点 很 重 
要 。 也 就 是 说 ， 如 有 果 硕 望 读 一 个 非 阻 罕 摘 述 符 ， 并 且 以 超时 值 为 5 秒 调 
用 select， 则 select 最 多 阻塞 5s。 相 类 似 ， 如 果 指 定 一 个 无 限 的 超时 值 ， 
则 在 该 摘 述 符 数 据 准 备 好 ， 或 捕捉 到 一 个 信号 之 前 ，select 会 一 直 阻 
3E o 

如 宁 在 一 个 描述 符 上 碰 到 了 文件 尾 端 ， 则 select 会 认为 该 摘 述 符 是 
可 读 鸭 。 然 后 调用 read， 它 返回 0， 这 是 UNIX 系 统 指示 到 达 文 件 尾 端的 
方法 。 〈 很 多 人 错误 地 认为 ， 当 到 达 文 件 尾 端 时 ， select 会 指示 一 个 异 
常 条 件 。) 

POSIX.1 也 定义 了 一 个 select 的 变 体 ， 称 为 pselect。 


#include <sys/select.h> 


int pselect(int maxfdp1, fd_set *restrict readfds, 
fd_set *restrict writefds, fd_set *restrict exceptfds, 


const struct timespec “restrict tsptr, 


const sigset_t *restrict sigmask); 
返回 值 : 准备 不 绪 的 描述 符 数 目 ， 看 超 时， 返回 0; 在 出 销 ， 返 回 -1 
除 下 列 几 点 外 ，pselect 与 select 相 同 。 
eselect HY) $E FY (E H timeval 24 #4) fa 7E , 1E pselect {E FA timespec 24 #4) 
(回忆 4.2 节 中 timespec 结 构 的 定义 ) 。timespec 结 构 以 秒 和 纳 秒表 示 超 
时 值 ， 而 非 秒 和 微 秒 。 如 有 果 平 台 文 持 这 样 的 时 间 精 度 ， 那 么 timespec 就 
能 提供 更 精准 的 超时 时 间 。 

pselect 的 超时 值 被 声明 为 const， 这 保证 了 调用 pselect 不 会 改变 此 
值 。 

*pselect 可 使 用 可 选 信号 屏蔽 字 。 奉 sigmask 为 NULL, ， 那 么 在 与 
言 号 有 关 的 方面 ， pselect 的 运行 状况 和 select 相同 。 人 否则 ，sigmask 18 
回 一 信号 屏蔽 字 ， 在 调用 pselect 时 ， 以 原子 操作 的 方式 安装 该 信号 屏蔽 
字 。 在 返回 时 ， 恢 复 以 前 的 信和 号 屏蔽 字 。 


14.4.2 函数 poll 


poll 函数 类 似 于 select， 但 是 程序 员 接口 有 所 不 同 。 虽 然 pol 函 数 是 
System V 引 入 进来 文 择 STREAMS 了 于 系统 的 ， 但 是 pol 函 数 可 用 于 任何 
类 型 的 文件 描述 符 。 

#include <poll.h> 


int poll(struct pollfd fdarray[], nfds_t nfds, int timeout); 
REE: ERAMANA H; AE, GRIGIO; ita, e- 
与 Select 不 同 ，poll 不 是 为 每 个 条 件 (可 读 性 、 可 写 性 和 异常 条 件 ) 
构造 一 个 描述 符 集 ， 而 是 构造 一 个 pollfd 结 构 的 数组 ， 每 个 数组 元 素 指 
定 一 个 描述 符 编 号 以 及 我 们 对 该 描述 符 感 兴趣 的 条 件 。 
struct pollfd { 


int fd; /* file descriptor to check, or « 0 to ignore */ 


short events; /* events of interest on fd */ 
short revents; /* events that occurred on fd */ 

bh 

fdarray 数 组 中 的 元 素数 由 nfds 指 定 。 

由 于 历史 原因 ， 在 如 何 声明 nfds 参数 方面 有 几 种 不 同 的 方式 。 
SVR3 将 nfds 的 类 型 指定 为 unsigned long， 这 似乎 是 太 大 了 。 在 SVR4 
手册 [AT&T 1990d] 中 ，pol 原 型 的 第 二 个 参数 的 数据 类 型 为 size tf (Ii 
图 2-21 中 的 基本 系统 数据 类 型 ) 。 但 在 <pollLh> 包 含 的 实际 原型 中 ， 第 
二 个 参数 的 数据 类 型 仍 指定 为 nsigned long » Single UNIX Specification 
定义 了 新 类 型 nfds t， 该 类 型 允许 实现 选择 对 其 合适 的 类 型 并 且 隐 藏 了 
应 用 细节 。 注 意 ， 因 为 返回 值 表 示 数 组 中 满足 事件 的 项 数 ， 所 以 这 种 
类 型 必须 大 得 足以 保存 一 个 整数 。 

对 应 于 SVR4 的 SVID[AT&T 1989] EAR, poll 的 第 一 个 参数 是 
struct pollfd fdarray[], ， 而 SVR4 手 册页 [AT&T 1990d] 上 则 显示 该 参数 为 
struct pollfd*fdarray。 在 C 语 言 中 ， 这 两 种 声明 是 等 价 的 。 我 们 使 用 第 
一 种 声明 是 为 了 重申 fdqarray 指 加 的 是 一 个 结构 数组 ， 而 不 是 指 回音 个 
结构 的 指针 。 

应 将 每 个 数组 元 素 的 events 成 员 设 置 为 图 14-17 中 所 示 值 的 一 个 或 
儿 个 ， 通 过 这 些 值 告诉 内 核 我 们 关心 的 是 每 个 搞 述 符 的 哪些 事件 。 返 
回 时 ，revents 成 员 由 内 核 设置 ， 用 于 说 明 每 个 描述 符 发 生 了 哪些 事 
件 。 (注意 ，poll 没 有 更 改 events 成 员 。 这 与 select 不 同 ，select 修 改 其 参 
数 以 指示 哪 一 个 描述 符 已 准备 好 了 。) 

图 14-17 中 的 前 4 行 测试 的 是 可 读 性 ， 接 下 来 的 3 行 测 试 的 是 可 写 
性 ， 最 后 3 行 测 斌 的 是 异常 条 件 。 最 后 3 行 是 由 内 核 在 返回 时 设置 的 。 
即使 在 events 字 上 段 中 没有 指定 这 3 个 值 ， 如 果 相 应 条 件 发 生 ， 在 revents 
中 也 会 返回 它们 。 


有 些 poll 事 件 的 名 字 中 包含 BAND， 它 指 的 是 STREAMS 当 中 的 优 
先 级 波段 。 想 要 了 解 关 于 STREAMS 和 优先 级 波段 的 更 多 信息 ， 可 以 查 
Æ Rago[1993] ° 


POLLIN . 可 以 不 阻塞 地 读 高 优先 级 数据 以 外 的 数 
据 ( 等 效 于 POLLRDNORM | POLLRDBAND) 
POLLRDNORM . 可 以 不 阻塞 地 读 普 通 数据 
POLLRDBAND . 可 以 不 阻塞 地 读 优 先 级 数据 
POLLPRI . 可 以 不 阻塞 地 读 高 优先 级 数据 


POLLOUT . 可 以 不 阻塞 地 写 普 通 数据 
LWRNORM . 与 POLLOUT 相同 
LWRBAND . 可 以 不 阻塞 地 写 优 先 级 数据 
. 已 出 错 
LNVRL 。 描述 符 没 有 引用 一 个 打开 文件 


图 14-17 poll 的 events 和 revents 标 志 


当 一 个 描述 符 被 挂 断 (POLLHUP) 后 ， 就 不 能 再 写 该 描述 符 ， 但 
是 有 可 能 仍然 可 以 从 该 描述 符 读 取 到 数据 。 
poll 的 最 后 一 个 参数 指定 的 是 我 们 愿意 等 竺 多 长 时 间 。 如 同 select 一 
样 ， 有 3 种 不 同 的 情形 。 
timeout == -1 
永远 等 待 。 ( 某 些 系统 在 <stropts.h> 中 定义 了 常量 INFTIM， 其 值 
通常 是 -1。) 当 所 指定 的 描述 符 中 的 一 个 已 准备 好 ， 或 捕捉 到 一 个 信和 号 
时 了 返回。 如 果 捕 捉 到 一 个 信和 号 ， 则 poll 返 回 -1，errno 设 置 为 EINTR。 
timeout == 0 
等 待 。 测 试 所 有 描述 符 并 立即 返回 。 这 是 一 种 轮 询 系 统 的 方 
法 ， 可 以 找到 多 个 描述 符 的 状态 而 不 阻 窟 poll 范 数 。 
timeout >0 
等 待 timeout 毫 秒 。 当 指定 的 描述 符 之 一 已 准备 好 ， 或 timeout 到 期 
时 立即 返回 。 如 果 timeout 到 期 时 还 没有 一 个 描述 符 准 备 好 ， 则 返回 值 


是 0。 (MR ASR GEES AE, WM timeout fet BOE S ig yr B] Sc $$ 
值 。) 

理解 文件 尾 端 与 挂 断 之 间 的 区 别 是 很 重要 的 。 如 果 我 们 正 从 终端 
输入 数据 ， 并 键入 文件 结束 符 ， 那 么 束 会 打开 POLLIN， 于 是 我 们 就 可 
以 读 文 件 结束 指示 (read 返 回 0) 。revents 中 的 POLLHUP 没 有 打开 。 如 
果 正 在 读 调制 解 调 器 ， 并 且 电 话 线 已 挂 断 ， 我 们 将 接 到 POLLHUP 通 
知 。 

与 Select 一样 ， 一 个 描述 符 是 否 阻塞 不 会 影响 pol 是 否 阻塞 。 

select 和 poll 的 可 中 断 性 

中 断 的 系统 调用 的 自动 重启 是 由 4.2BSD 引 入 的 (10577) ， 但 
当时 select 函 数 是 不 重 局 的 。 这 种 特性 在 大 多 数 系统 中 一 直 延 续 了 下 
来 ， 即 使 指定 了 SA_RESTARIT 选 项 也 是 如 此 。 但 是 ， 在 SVR4 上 ， 如 采 
指定 了 SA_RESTART， 那 么 select 和 poll 也 是 自动 重启 的 。 为 了 在 将 软 
件 移 植 到 SVR4 派 生 的 系统 上 时 阻止 这 一 点 ， 如 果 信 号 有 可 能 会 中 断 
select 或 poll， 就 要 使 用 signal_intr 函 数 〈 见 图 10-19) ° 

本 书 说 明 的 各 种 实现 在 接 到 一 信号 时 都 不 重启 动 pol 和 select， 即 便 
使 用 了 SA_RESTART 标 志 也 是 如 此 。 


14.5 FZ 1/O 


使 用 上 一 节 说 明 的 select 和 poll 可 以 实现 异步 形式 的 通知 。 关 于 描述 
符 的 状态 ， 系 统 并 不 主动 告诉 我 们 任何 信息 ， 我 们 需要 进行 查询 (UR 
用 select 或 poll) 。 如 在 第 10 章 中 所 述 ， 信 号 机 构 提 供 了 一 种 以 异步 形式 
通知 某 种 事件 已 发 生 的 方法 。 由 BSD 和 System V 派 生 的 所 有 系统 都 提供 
了 某 种 形式 的 异步 WO， 使 用 一 个 信号 〈 在 System V 中 是 SIGPOLL ， 在 
BSD 中 是 SIGIO) 通知 进程 ， 对 某 个 描述 符 所 关心 的 某 个 事件 已 经 发 


生 。 我 们 在 前 面 的 章节 中 提 到 过 ， 这 些 形式 的 异步 JO 是 受 限 制 的 : 它 
们 并 不 能 用 在 所 有 的 文件 类 型 上 ， 而 且 只 能 使 用 一 个 信号 。 如 果 要 对 
一 个 以 上 的 描述 符 进行 异步 WO， 那 么 在 进程 接收 到 该 信号 时 并 不 知道 
这 一 信号 对 应 于 哪 一 个 描述 符 。 

SUSv4 中 将 通用 的 异步 VO 机 制 从 实时 扩展 部 分 调整 到 基本 规范 部 
分 。 这 种 机 制 解决 了 这 些 陈旧 的 异步 WO 设施 存在 的 局 限 性 。 

在 我 们 了 解 使 用 异步 VO 的 不 同方 法 之 前 ， 需 要 先 讨 论 一 下 成 本 。 
在 用 异步 IO 的 时 候 ， 要 通过 选择 来 灵活 处 理 多 个 并 发 操作 ， 这 会 使 应 
用 程序 的 设计 复杂 化 。 更 简单 的 做 法 可 能 是 使 用 多 线程 ， 使 用 同步 模 
型 来 编写 程序 ， 并 让 这 些 线程 以 异步 的 方式 运行 。 

使 用 POSIX 异 步 JO 接 口 ， 会 带 来 下 列 麻 烦 。 

"每 个 异步 操作 有 3 处 可 能 产生 错误 的 地 方 ， 一 处 在 操作 提交 的 部 
分 ,一 处 在 操作 本 身 的 结果 ， 还 有 一 处 在 用 于 决定 异步 操作 状态 的 函 
数 中 。 

“与 POSIX 异 步 JO 接 口 的 传统 方法 相 比 ， 它 们 本 身 涉及 大 量 的 额外 
设置 和 处 理 规则 。 

事实 上 ， 并 不 能 把 非 异 步 JO 函 数 称 作 “同步 ?的 ， 因 为 尽管 它们 相 
对 于 程序 流 来 说 是 同步 的 ， 但 相对 于 IO 来 说 并 非 如 此 。 回 忆 第 3 章 中 关 
于 同步 写 的 讨论 。 当 从 write 函数 的 调用 返回 时 ， 写 的 数据 是 持久 的 ， 
我 们 称 这 个 写 操 作为 “同步 ”的 。 也 不 能 依靠 把 传统 的 调用 归 类 为 “标准 ” 
的 VO 调用 来 区 别传 统 的 VO 函数 和 异步 /0 函数 ， 因 为 这 样 会 使 它们 和 
标准 IO 库 中 的 函数 调用 相 混 请。 为 了 避免 产生 这 种 混 消 ， 本 世 中 我 们 
把 read 和 write 范 数 归 类 为 “传统 ”的 /OO 函数 。 

"从 错误 中 恢复 可 能 会 比较 困难 。 举 例 来 说 ， 如 果 提 交 了 多 个 异步 
写 操作 ， 其 中 一 个 失败 了 ， 下 一 步 我 们 应 该 怎么 做 ? 如 果 这 些 写 操作 
是 相关 的 ， 那 么 可 能 还 需要 撤销 所 有 成 功 的 写 操作 。 


14.5.1 System V 异 步 /O 


f£ System V 中 ， 异 步 VO 是 STREAMS 系 统 的 一 部 分 ， 
STREAMS 设 备 和 STREAMS 管 道 起 作用 。System V 的 异步 /O 信 号 是 
SIGPOLL 。 

为 了 对 一 个 STREAMS 设 备 启 动 异 步 JO， 需 要 调用 iocd， 将 它 的 第 
二 个 参数 (request) oom 。 第 三 个 参数 是 由 图 14-18 中 的 一 
个 或 多 个 常量 构成 的 整 型 值 。 这 些 常量 是 在 <stropts.h> 中 定义 的 。 

A SUSv4 中 已 被 标记 为 弃 用 ， 所 以 这 
里 不 讨论 它们 的 任何 细节 。 关 于 STREAMS 的 信息 详 见 Rago[1993]。 

除了 调用 ioctl 指 定 产 生 SIGPOLL 信 和 号 的 条 件 以 外 ， 还 应 为 该 信号 
建立 信号 处 理 程序 。 回 忆 图 10-1， 对 于 SIGPOLL 的 默认 动作 是 终止 该 
进程 ， 所 以 应 当 在 调用 ioctl 之 前 建立 信号 处 理 程序 。 


说 明 


S_INPUT 可 以 不 阻塞 地 读 取 数 据 ( 非 高 优先 级 数据 》 

S_RDNORM 可 以 不 阻塞 地 读 取 普通 数据 

S_RDBAND 可 以 不 阻塞 地 读 取 优先 级 数据 

S_BANDURG 若 此 常量 和 S_RDBAND 一 起 指定 ， 当 我 们 可 以 不 阻塞 地 读 取 
优先 数据 时 ， 产 生 STGURG 信号 而 非 SIGPOLL 


S_HIPRI 可 以 不 阻塞 地 读 取 高 优先 级 数据 
S_OUTPUT 可 以 不 阻塞 地 写 普通 数据 

S WRNORM E s output 相同 

S WRBAND 可 以 不 阻塞 地 写 优 先 级 数据 

S MSG 包含 SIGPOLL 信和 号 的 消息 已 经 到 达 流 头 部 
S_ERROR 流 有 错误 

S HANGUP 流 已 挂 起 


图 14-18 产生 SIGPOLL 信 和 号 的 条 件 


14.5.2 BSD 异 步 VO 


在 BSD 派 生 的 系统 中 ， 异 步 WO 是 信号 SIGIO 和 SIGURG 的 组 合 。 
SIGIO 是 通用 异步 WO 信号 ，SIGURG 则 只 用 来 通知 进程 网 络 连 接 上 的 带 
外 数据 已 经 到 达 。 

为 了 接收 SIGIO 信 号 ， 需 执行 以 下 3 步 。 

(1) 调用 signal 或 sigaction 为 SIGIO 信 和 号 建立 信号 处 理 程 序 。 

(2) 以 命令 F_SETOWN ( 见 3.14 节 ) 调用 fcnt 来 设置 进程 ID 或 进 
程 组 ID， 用 于 接收 对 于 该 描述 符 的 信号 。 

(3) 以 命令 F_SETFL 调 用 fcntl 设 置 O0_ASYNC 文 件 状态 标志 (UL 
图 3-10) ， 使 在 该 描述 符 上 可 以 进行 异步 JO 。 

第 3 步 仅 能 对 指向 终端 或 网 络 的 描述 符 执行 ， 这 是 BSD 异 步 WO 设 施 
的 一 个 基本 限制 。 

对 于 SIGURG 信 号 ， 只 需 执行 第 1 步 和 第 2 步 。 该 信号 仅 对 引用 支持 
带 外 数据 的 网 络 连 接 描述 符 而 产生 ， 如 TCP 连 接 。 


14.5.3 POSIX ###1/0 


POSIX 异 步 /O 接 口 为 对 不 同类 型 的 文件 进行 异步 /O 提 供 了 一 套 一 
致 的 方法 。 这 些 接口 来 和 目 实 时 草案 标准 ， 该 标准 是 Single UNIX 
Specification 的 可 选项 。 在 SUSv4 中 ， 这 些 接口 被 移 到 了 基本 部 分 中 ， 
所 以 现在 所 有 的 平台 都 被 要 求 文 持 这 些 接口 。 

这 些 异 步 /O 接 口 使 用 AIO 控 制 块 来 描述 1/O 控 作 。aiocb 结 构 定 义 了 
AIO 控 制 块 。 该 结构 至 少 包括 下 面 这 些 字段 (具体 的 实现 可 能 还 包含 有 
额外 的 字段 ) : 


struct aiocb ( 


int aio fildes; /* file descriptor */ 
off t aio offset; /* file offset for I/O */ 


volatile void *ajio buf; /* buffer for I/O */ 


size t aio nbytes; /* number of bytes to 


transfer */ 


int aio reqprio; /* priority */ 
struct sigevent alo. sigevent; /* signal information */ 
int aio lio opcode;  /* operation for list I/O 
*/ 
p 


aio fields 字段 表示 被 打 开 用 来 读 或 写 的 文件 描述 符 。 读 或 写 操 作 
从 aio offset 指定 的 偏 移 量 开 始 。 对 于 读 操 作 ， 数 据 会 复制 到 缓冲 区 
中 ， 该 缓冲 区 从 aio buf 指定 的 地 址 开始 。 对 于 写 操作 ， 数 据 会 从 这 个 
绥 神 区 中 复制 出 来 。aio_nbytes 字 段 包 含 了 要 读 或 写 的 字 贡 数 。 

注意 ， 异 步 1/O 操 作 必 须 显 式 地 指定 偏 移 量 。 异 步 /O 接 口 并 不 影响 
由 操作 系统 维护 的 文件 偏 移 量 。 只 要 不 在 同一 个 进程 里 把 异步 WO 函数 
和 传统 IO 函数 混在 一 起 用 在 同一 个 文件 上 ， 融 不 会 导致 什么 问题 。 同 
时 值得 注意 的 是 ， 如 果 使 用 异步 WO 接口 向 一 个 以 追加 模式 (使 用 
O APPEND) 打开 的 文件 中 写 入 数据 ，AIO 控 制 块 中 的 aio_offset 字 段 会 
被 系统 忽略 。 

其 他 字段 和 传统 MO 函数 中 的 不 一 致 。 应 用 程序 使 用 aio_reqprio 字 
段 为 异步 IO 请 求 提 示 顺 序 。 然 而 ， 系 统 对 于 该 顺序 只 有 有 限 的 控制 能 
力 ， 因 此 不 一 定 能 遵循 该 提示 “。aio_lio_opcode 字 段 只 能 用 于 基于 列表 
的 异步 JO， 我 们 在 稍 后 再 讨论 它 。aio_sigevent 字 段 控 制 ， 在 IO 事件 完 
成 后 ， 如 何 通知 应 用 程序 。 这 个 字段 通过 sigevent 结 构 来 描述 。 


struct sigevent { 


int sigev notify; /* notify 
type */ 
int sigev signo; /* signal 


number */ 


union sigval sigev value; /* notify 
argument */ 
void (*sigev notify function)(union sigval); /* notify 
function */ 
pthread attr t *sigev notify attributes; /* notify attrs 
*/ 
ie 
sigev_notify 字 段 控制 通知 的 类 型 。 取 值 可 能 是 以 下 3 个 中 的 一 个 。 
SIGEV_NONE 异步 WO 请 求 完成 后 ， 不 通知 进程 。 
SIGEV_SIGNAL 异步 WO 请 求 完 成 后 ， 产 生 由 sigev_signo 字 上 段 指定 
的 信号 。 如 采 应 用 程序 已 选择 捕捉 信号 ， 且 在 建立 信号 处 理 程序 的 时 
候 指 定 了 SA SIGINFO 标志 ， 那 么 该 信号 将 被 入 队 《如 果实 现 文 持 排 
队 信号 ) 。 信 和 号 处 理 程序 会 传送 给 一 个 siginfo 结 构 ， 该 结构 的 si_value 
字段 被 设置 为 sigev_value (如 果 使 用 了 SA_SIGINFO 标 志 ) ° 
SIGEV THREAD 当 异 步 /O 请 求 完 成 时 ， 由 sigev_notify_function 
字段 指定 的 函数 被 调用 。sigev_value 字 上 段 被 传 入 作为 它 的 唯一 参数 。 除 
jEsigev notify attributes 字段 被 设 定 为 pthread 属性 结构 的 地 址 ， 且 该 结 
构 指 是 了 一 个 另外 的 线程 属性 ， 否 则 该 琅 数 将 在 分 离 状态 下 的 一 个 单 
独 的 线程 中 执行 。 
在 进行 异步 WO 之 前 需要 先 初 始 化 AIO 控 制 块 ， 调 用 aio_read 函 数 来 
进行 异步 读 操 作 ， 或 调用 aio_write 范 数 来 进行 异步 写 操作 。 


#include <aio.h> 


int aio_read(struct aiocb *aiocb); 
int aio. write(struct aiocb *aiocb); 
两 个 函数 的 返回 值 : a, keo AE, ge- 
当 这 些 函 数 返回 成 功 时 ， 异 步 1/O 请 求 便 已 经 被 操作 系统 放 入 等 待 
处 理 的 队列 中 了 。 这 些 返 回 值 与 实际 WO 操作 的 结果 没有 任何 关系 。LO 


操作 在 等 竺 时， 必须 注意 确保 AIO 探 制 块 和 数据 库 缓 神 区 保持 稳定 ; E 
们 下 面 对 应 的 内 存 必 须 始终 是 合法 的 ， 除 非 VO 操 作 完 成 ， 否 则 不 能 被 
iH 

要 想 强 制 所 有 等 得 中 的 异步 操作 不 等 得 而 写 入 持久 化 的 存储 中 ， 
可 以 设立 一 个 AIO 控制 块 并 调用 aio_fsync 函 数 。 

#include <aio.h> 

int aio_fsync(int op, struct aiocb *aiocb); 

REE: ERJ, wo; Aut, we- 

AIO 控 制 块 中 的 aio_fildes 字 上 段 指定 了 其 异步 写 操作 被 同步 的 文件 。 
如 果 op 参 数 设 定 为 0O_DSYNC， 那 么 操作 执行 起 来 就 会 像 调 用 了 
fdatasync 一 样 。 人 和 否则， 如果 op 参数 设 定 为 0 SYNC， 那 么 操作 执行 起 来 
就 会 像 调用 了 fsync 一 样 。 

像 aio_read 和 aio_write 函 数 一 样 ， 在 安排 了 同步 时 ，aio_fsync 操 作 
返回 。 在 异步 同步 操作 完成 之 前 ， 数 据 不 会 被 持久 化 。AIO 控制 块 控 
制 我 们 如 何 补 通知， 束 像 aio_read 和 aio_write 范 数 一 样 。 

为 了 获知 一 个 异步 读 、 写 或 者 同步 操作 的 完成 状态 ， 需 要 调用 
aio_errorEK RY ° 


#include <aio.h> 
int aio_error(const struct aiocb *aiocb); 

REME: (LF) 
返回 值 为 下 面 4 种 情况 中 的 一 种 。 
0 异步 操作 成 功 完成 。 需 要 调用 aio_return 函 数 获 取 操 作 返 回 值 。 
对 aio_error 的 调用 失败 。 这 种 情况 下 ，errno 会 告诉 我 们 为 什么 。-1 
EINPROGRESS 异步 读 、 写 或 同步 操作 仍 在 等 待 。 
其 他 情况 其 他 任何 返回 值 是 相关 的 异步 操作 失败 返回 的 错误 码 。 
如 果 异 步 操 作成 功 ， 可 以 调用 aio_retum 函 数 来 获取 异步 操作 的 返 

回 值 。 


#include <aio.h> 
ssize_t aio_return(const struct aiocb *aiocb); 
返回 值 : ( 见 下 ) 

直到 异步 操作 完成 之 前 ， 部 需要 个 心 个 要 调用 aio_ return i o» f 
作 完 成 之 前 的 结果 是 未 定义 的 。 还 需要 小 心 对 每 个 异步 操作 只 调用 一 
alo jenm « —HUUS T WERL. A DEREN AL & TOR 
作 返 回 值 的 记录 。 

"l| aio return ER WAS RM, 
B. ERAS REN, BU 
功 调用 时 可 能 返回 的 结 

执行 IO 操作 时 ， 如 采 还 有 其 他 事务 要 处 理 而 不 想 被 TO 操 作 阻 豆 ， 
束 可 以 使 用 异步 OO。 然而， 如 条 在 完成 了 所 有 事务 时 ， 还 有 弄 步 操作 
未 完成 时 ， 可 以 调用 aio_suspend 函 数 来 阻 堵 进程， 直到 操作 完成 。 


#include <aio.h> 


会 返回 -1， 并 设置 errmo。 其 他 情况 
返回 read、write 或 者 fsync 在 被 成 


Hp Xp 


int aio_suspend(const struct aiocb *const list[], int nent, 
const struct timespec *timeout); 
返回 值 : AB, iR[BO; 者 出 错 ， 返 回 -1 
aio suspend 可 能 会 返回 三 种 情况 中 的 一 种 。 如 采 我 们 被 一 个 信和 号 
中 断 ， 它 将 会 返回 -1， 并 将 errno 设 置 为 EINTR“。 如 果 在 没有 me 
EZR P, BÆRI EES T KA TX] timeout 参数 所 指定 
的 时 间 限 制 ， 那 么 aio suspend 将 返回 -1， 并 将 errno 设置 为 EAGAIN 
(不 想 设置 任何 时 间 限 制 的 话 ， 可 以 把 空 指针 传 给 timeout 参 数 ) 。 如 
果 有 任何 IO 操作 完成 ，aio_suspend 将 返回 0。 如 果 在 我 们 调用 
aio_suspend 探 作 时 ， 所 有 的 异步 IO 操作 都 已 完成 ， 那 么 aio_suspend 将 
在 不 阻塞 的 情况 下 直接 返回 。 

list 参 数 是 一 个 指向 AIO 控 制 块 数组 的 指针 ，nent 参 数 表 明了 数组 中 
的 条 目 数 。 数 组 中 的 空 指针 会 被 跳 过 ， 其 他 条 目 都 必须 指向 已 用 于 初 


台 化 异步 IO 操作 的 AIO 控 制 块 。 

当 还 有 我 们 不 想 再 完成 的 等 待 中 的 异步 IO 操作 时 ， 可 以 尝试 使 用 
aio_cancel 函 数 来 取消 它们 。 

#include <aio.h> 

int aio_cancel(int fd, struct aiocb *aiocb); 

返回 值 : (F) 

fd 参数 指定 了 那个 未 完成 的 异步 /0 操作 的 文件 描述 符 。 如 果 aiocb 
参数 为 NULL， 系 统 将 会 尝试 取消 所 有 该 文件 上 未 完成 的 异步 /O 探 
作 。 其 他 情况 下 ， 系 统 将 党 试 取消 由 AIO 控 制 块 描述 的 单个 异步 IO 操 
作 。 我 们 之 所 以 说 系统 “党 试 ? 取 消 操作 ， 是 因为 无 法 保证 系统 能 够 取 
消 正在 进程 中 的 任何 操作 。 

aio_cancel 函 数 可 能 会 返回 以 下 4 个 值 中 的 一 个 。 

AIO ALLDONE 所 有 操作 在 尝试 取消 它们 之 前 已 经 完成 。 

AIO CANCELED PA XESERSTRTE UE ° 

AIO NOTCANCELED 至 少 有 一 个 要 求 的 操作 没有 被 取消 。 

-1 对 aio_cancel 的 调用 失败 ， 错 误 码 将 被 存储 在 errmmo 中 。 

如 有 果 异 步 /O 操 作 被 成 功 取消 ， 对 相应 的 AIO 控 制 块 调用 aio_error 函 
数 将 会 返回 错误 ECANCELED。 如果 操作 不 能 被 取消 ， 那 么 相应 的 AIO 
控制 块 不 会 因为 对 aio_cancel 的 调用 而 被 修改 。 

还 有 一 个 函数 也 被 包含 在 异步 JO 接 口 当 中 ， 尽 管 它 既 能 以 同步 的 
方式 来 使 用 ， 又 能 以 异步 的 方 

式 来 使 用 ， 这 个 函数 就 是 lio_listio。 该 函数 提交 一 系列 由 一 个 AIO 
控制 块 列表 描述 的 VO 请 求 。 


#include <aio.h> 


int lio_listio(int mode, struct aiocb *restrict const list[restrict], 
int nent, struct sigevent *restrict sigev); 


REE: ARD, wo AE, we- 
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mode 2 Zt E T VOZé d E Byz BI WIR AI OEN 
LIO_WAIT，lio_listio 函 数 将 在 所 有 由 列表 指定 的 IO 操作 完成 后 返回 。 
在 这 种 情况 下 ，sigev 参 数 将 被 忽略 。 如 果 mode 参 数 被 设 定 为 
LIO_NOWAIT，1lio_listio 函 数 将 在 IO 请 求 入 队 后 立即 返回 。 进 程 将 在 
所 有 IO 操作 完成 后 ， 按 照 sigev 参 数 指定 的 ， 被 异步 地 通知 。 如 果 不 想 
被 通知 ， 可 以 把 sigev 设 定 为 NULL。 注 意 ， 每 个 AIO 控 制 块 本 身 也 可 能 
启用 了 在 各 上 自 操作 完成 时 的 异步 通知 。 被 sigev 参 数 指定 的 异步 通知 是 
在 此 之 外 画 加 的 ， 并 且 只 会 在 所 有 的 IO 操作 完成 后 发 送 。 

list 参 数 指向 AIO 探 制 块 列 表 ， 该 列表 指定 了 要 运行 的 MO 操作 的 。 
nent 参 数 指定 了 数组 中 的 元 素 个 数 。AIO 控 制 块 列表 可 以 包含 NULL 指 
针 ， 这 些 条 目 将 被 忽略 。 

在 每 一 个 AIO 探 制 块 中 ，aio_lio_opcode 字 段 指定 了 该 操作 是 一 个 
读 操作 (LIO READ) 、 写 操作 (LIO WRITE) ， 还 是 将 被 忽略 的 空 
操作 (LIO_NOP) 。 读 操作 会 按照 对 应 的 AIO 控制 块 被 传 给 了 
aio_read 函 数 来 处 理 。 类 似 地 ， 写 操作 会 按照 对 应 的 AIO 挥 制 块 被 传 给 
[f aio_write ER Zoe AH o 

实现 会 限制 我 们 不 想 完成 的 异步 VO 操作 的 数量 。 这 些 限制 都 是 运 
行 时 不 变量 ， 其 总 结 如 图 14-19 所 示 。 

可 以 通过 调用 sysconf EX 2X Jf dE name 参数 设置 为 
_SC_IO_LISTIO MAX 来 设 定 AIO_LISTIO_MAX 的 值 。 类 似 地 ， 可 以 
通过 调用 sysconf Jf $E name & ZX ix H H SC AIO MAX 3% ix E 
AIO MAX 的 值 ， 通 过 调用 sysconf 并 把 其 参数 设置 为 
_SC_AIO_PRIO_DELTA_MAX 来 设 定 AIO_PRIO_DELTA_MAX 的 值 。 


AIO LISTIO MAX 单个 列表 VO 调用 中 的 最 大 VO 操作 数 POSIX AIO LISTIO MAX (2) 
AIO MAX 未 完成 的 异步 VO 操作 的 最 大 数目 POSIX AIO MAX (1) 
AIO PRIO DELTA MAX | 进程 可 以 减少 的 其 异步 IO 优先 级 的 最 大 值 | 0 


图 14-19 POSIX.1 中 的 异步 IO 运行 时 不 变量 的 值 

引入 POSIX 异 步 操 作 IMO 接 口 的 初 囊 是 为 实时 应 用 提供 一 种 方法 ， 
避免 在 执行 1O 操 作 时 阻塞 进程 。 接 下 来 就 让 我 们 来 看 一 个 使 用 这 些 接 
口 的 例子 。 

实例 

虽然 我 们 不 会 在 本 文中 讨论 实时 编程 ， 但 因为 POSIX 异步 UO 接 
口 现 在 是 Single UNIX Specification 的 基本 部 分 ， 所 以 我 们 要 了 解 一 下 
怎么 使 用 它们 。 为 了 对 比 异 步 JO 接 口 和 相应 的 传统 IO 接 口 ， 我 们 来 研 
究 一 个 任务 ， 将 一 个 文件 从 一 种 格式 翻译 成 男 一 种 格式 。 

图 14-20 中 展示 的 程序 ， 使 用 20 世 纪 80 年 代 流行 的 USENET 新 闻 系 
统 中 使 用 的 ROT-13 算 法 ， 翻 译文 件 ， 该 算法 原本 用 于 将 文本 中 的 带 有 
侵犯 性 的 或 者 舍 有 剧 透 和 笑话 笑 点 部 分 的 文本 模糊 化 。 该 算法 将 文本 
中 的 身 文 字符 a8~z 和 A~Z 分 别 循环 向 右 偏 移 13 个 字母 位 移 ， 但 不 改变 
其 他 字符 。 


#include "apue.h" 
#include <ctype.h> 
#include «fcntl.h» 


#define BSZ 4096 
unsigned char buf[BSZ]; 


unsigned char 
translate (unsigned char c) 
{ 
if (isalpha(c)) { 
if (G >= ny") 


人 == 13; 

else if (c >= 'a') 
c += 13; 

else if (c >= 'N') 
e Es 

else 
c += 13; 


} 


return (c); 


int 
main(int argc, char* argv[]) 
{ 


Aint Ltd, Ofd, d, Ti iw; 


if (argc !- 3) 
err quit("usage: rotl13 infile outfile"); 

if ((ifd = open(argv[1], O RDONLY)) « 0) 
err sys("can't open $s", argv[1]); 

if ((ofd = open(argv[2], O RDWR|O CREAT|O TRUNC, FILE MODE)) < 0) 
err sys("can't create $s", argv[2]); 


while ((n = read(ifd, buf, BSZ)) > 0) { 


for (i = 0; i < n; i++) 
buf[i] = translate (buf[i]); 
if ((nw = write(ofd, buf, n)) !=n) { 


if (nw < 0) 
err_sys("write failed"); 
else 
err quit("short write (%d/%d)", nw, n); 


fsync(ofd); 
exit(0); 


图 14-20 用 ROT-13 翻 译 一 个 文件 


程序 中 的 IO 部 分 是 很 直接 的 : 从 输入 文件 中 读 取 一 个 块 ， 翻 译 
之 ， 然 后 再 把 这 个 块 写 到 输出 文件 中 。 重 复 该 步骤 直到 遇 到 文件 尾 
端 ，read 返 回 0。 图 14-21 中 的 程序 展示 了 如 何 使 用 等 价 的 异步 IO 函数 
做 同样 的 任务 。 


#include "apue.h" 


#include «ctype.h» 
#include «fcntl.h» 
#include <aio.h> 


#include <errno.h> 


#define BSZ 4096 
#define NBUF 8 


enum rwop { 
UNUSED = 0, 
READ PENDING = 1, 
WRITE PENDING = 2 
}; 


struct buf { 
enum rwop Op; 
int last; 
struct aiocb aiocb; 
unsigned char data [BSZ]; 
}; 


struct buf bufs[NBUF]; 
unsigned char 
translate (unsigned char c) 
{ 

/* same as before */ 


int 
main(int argc, char* argv[]) 


{ 


int ifd, ofd, i, j, n, err, numop; 
struct stat sbuf; 

const struct aiocb *aiolist[NBUF]; 

off t off = 0; 


if (arge != 3) 
err quit("usage: rotl3 infile outfile"); 
if ((ifd = open(argv[1], O RDONLY)) « 0) 
err sys("can't open $s", argv[1]); 
if ((ofd = open(argv[2], O RDWR|O CREAT|O TRUNC, FILE MODE)) « 0) 
err sys("can't create $s", argv[2]); 
if (fstat(ifd, &sbuf) < 0) 
err sys("fstat failed"); 


/* initialize the buffers */ 

for (i = 0; i < NBUF; i++) { 
bufs[i].op = UNUSED; 
bufs[i].aiocb.aio buf = bufs[i].data; 
bufs[i].aiocb.aio_sigevent.sigev_notify = SIGEV_NONE; 
aiolist[i] = NULL; 


numop = 0; 
for (a) i 
for (i = 0; i < NBUF; i++) ( 
Switch (bufs[il.op) ( 
case UNUSED: 
/* 
* Read from the input file if more data 
* remains unread. 

my 

if (off < sbuf.st_size) { 
bufs[i].op = READ PENDING; 
bufs[i].aiocb.aio fildes = ifd; 
bufs[i].aiocb.aio offset off: 
off += BSZ; 
if (off >= sbuf.st size) 

bufs[i].last = 1; 
bufs[i].aiocb.aio nbytes - BSZ; 
if (aio read(&bufs[i].aiocb) < 0) 
err sys("aio read failed"); 

aiolist[i] = &bufs[i].aiocb; 
numop++; 


} 


break; 


case READ PENDING: 
if ((err = aio_error(&bufs[i].aiocb)) == EINPROGRESS) 
continue; 
if (err != 0) { 


if (err -- -1) 

err sys("aio error failed"); 
else 

err exit(err, "read failed"); 


/* 
* A read is complete; translate the buffer 
* and write it. 
i 
if ((n = aio return(&bufs[i].aiocb)) < 0) 
err sys("aio return failed"); 
if (n != BSZ && !bufs[i].last) 
err quit("short read ($d/$d)", n, BSZ); 
for (5j = 0; 3 « m: g++) 
bufs[i].data[j] = translate (bufs[i].data[j]); 
bufs[i].op = WRITE_PENDING; 
bufs[i].aiocb.aio fildes ofd; 
bufs[i].aiocb.aio_nbytes = n; 


if (aio write(&bufs[i].aiocb) < 0) 

err sys("aio write failed"); 
/* retain our spot in aiolist */ 
break; 


case WRITE PENDING: 


if ((err = aio error(&bufs[i].aiocb)) == EINPROGRESS) 
continue; 
if (err != 0) { 
if (err == -1) 
err_sys("aio_error failed"); 
else 


err exit(err, "write failed"); 


/* 
* A write is complete; mark the buffer as unused. 
aay 
if ((n = aio return(&bufs[i].aiocb)) < 0) 
err_sys("aio_return failed"); 
if (n != bufs[i].aiocb.aio_nbytes) 
err quit ("short write (%d/%d)", n, BSZ); 
aiolist[i] = NULL; 
bufs[i].op = UNUSED; 


numop--; 
break; 
] 
) 
if (numop == 0) { 
if (off >= sbuf.st size) 
break; 
) else ( 


if (aio suspend(aiolist, NBUF, NULL) « 0) 
err sys("aio suspend failed"); 


bufs[0].aiocb.aio fildes = ofd; 
if (aio fsync(O SYNC, &bufs[0].aiocb) « 0) 
err sys("aio fsync failed"); 


图 14-21 用 ROT-13 和 异步 1/O 翻 译 一 个 文件 


注意 ， 我 们 使 用 了 8 个 缓冲 区 ， 因 此 可 以 有 最 多 8 个 异步 W/O 请 求 处 
于 等 竺 状态 。 令 人 惊讶 的 是 ， 实 际 上 这 可 能 会 降低 性 能 ， 因 为 如 采 读 
操作 是 以 无 序 的 方式 提交 给 文件 系统 的 ， 操 作 系统 提前 读 的 算法 便 会 
失效 。 

在 检查 操作 的 返回 值 之 前 ， 必 须 确 认 操 作 已 经 完成 。 当 aio_error 返 
回 的 值 既 非 EINPROGRESS 亦 非 -1 时 ， 表 明 操 作 完 成 。 除 了 这 些 值 之 
外 ， 如 果 返 回 值 是 0 以 外 的 任何 值 ， 说 明 操 作 失 败 了 。 一 旦 检查 过 这 些 
情况 ， 便 可 以 安全 地 调用 aio_return 来 获取 IO 操作 的 返回 值 了 。 

只 要 还 有 事情 要 做 ,或 可 以 提交 异步 WO 操作 。 当 存在 未 使 用 的 
AIO 控 制 块 时 ， 可 以 提交 一 个 异步 读 操 作 。 读 操作 完成 后 ， 翻 译 缓冲 区 
中 的 内 容 并 将 它 提 交 给 一 个 异步 写 请 求 。 当 所 有 AIO 控 制 块 都 在 使 用 中 
时 ， 通 过 调用 aio_suspend 等 待 操作 完成 。 

在 把 一 个 块 写 入 输出 文件 时 ， 我 们 保留 了 在 从 输入 文件 读 取 数据 
时 的 偏 移 量 。 因 而 写 的 顺序 并 不 重要 。 这 一 策略 仅 在 输入 文件 中 每 个 
字符 和 输出 文件 中 对 应 的 字符 的 仿 移 量 相 同 的 情况 下 适用 ， 我 们 在 输 
出 文件 中 既 没 有 添加 字符 也 没有 删除 字符 。 

这 个 实例 中 并 没有 使 用 异步 通知 ， 因 为 使 用 同步 编程 模型 更 加 们 
单 。 如 采 在 IO 操作 进行 时 还 有 别 的 事情 要 做 ， 那 么 额外 的 工作 可 以 包 
含 在 for 循 环 当 中 。 然 而 ， 如 有 果 需 要 阻止 这 些 额 外 的 工作 延迟 翻译 文件 
的 任务 ， 那 么 就 需要 组 织 下 代码 使 用 异步 通知 。 多 任务 情况 下 ， 决 定 
程序 如 何 建构 之 前 需要 移 考 虑 各 个 任务 的 优先 级 。 


14.6 readv7ilwritev 


readv fi writev Ex A F] FE — UX ER BN A SE ^ 5 ge EER R ID 
区 。 有 时 也 将 这 两 个 函数 称 为 散布 读 (scatter read) MRR (gather 
write) ° 
#include <sys/uio.h> 
ssize_t readv(int fd, const struct iovec *iov, int iovcnt); 
ssize_t writev(int fd, const struct iovec *iov, int iovcnt); 
AMARA: 已 读 或 已 写 的 字 节 数 ; uf. we- 
这 两 个 芳 数 的 第 二 个 参数 是 指 疝 iovec 结 构 数 组 的 一 个 指针 : 
struct iovec { 
void *iov_base; /* starting address of buffer */ 
size tiov len; /* size of buffer */ 
H 
iov 数 组 中 的 元 素数 由 iovcnt 指 定 ， 其 最 大 值 受 限于 IOV_MAX (Inl 
忆 图 2-11) 。 图 14-22 显 示 了 这 两 个 函数 的 参数 和 iovec 结 构 之 间 的 关 
系 。 
writev 函数 从 缓冲 区 中 聚集 输出 数据 的 顺序 是 : iov[0]、iov[1] 直 至 
iov[iovcnt-1]。writev 返 回 输出 的 字 市 总 数 ， 通 常 应 等 于 所 有 缓冲 区 长 度 
之 和 。 


[S— — ceo + 


RH 缓冲 区 1 


| 一 长 度 1 — 


I — KEN 


iov[0].iov base 


iov[0].iov len 


iov[1].iov base 


iov[1].iov len 


iov[iovcnt-1].iov base 


iov [iovcnt-1].iov len 


图 14-22 readv 和 writev 的 iovec 结 构 


readv 函数 则 将 读 入 的 数据 按 上 述 同样 顺序 散布 到 缓冲 区 中 。readv 
总 是 完 填 满 一 个 缓冲 区 ， 然 后 再 填写 下 一 个 。readv 返 回 读 到 的 字 方 总 
数 。 如 有 果 遇 到 文件 尾 端 ， 已 无 数据 可 读 ， 则 返回 0。 
这 两 个 函数 始 于 4.2BSD ， 后 来 ，SVR4 也 提供 它们 。 在 Single 
UNIX Specification 时 XSI 扩 展 中 包括 了 这 两 个 函数 。 
实例 
在 20.8 节 的 _db_writeidx 函数 中 ， 需 将 两 个 缓冲 区 中 的 内 容 连 续 地 
写 到 一 个 文件 中 。 第 二 个 缓冲 区 是 调用 者 传递 过 来 的 一 个 参数 ， 第 一 
ee en 它 包含 了 第 二 个 缓冲 的 长 度 以 及 文件 中 其 他 
言 妃 的 文件 偏 移 量 。 有 以 下 3 种 方法 可 以 实现 这 一 要 求 。 
(1) 调用 两 次 write， 每 个 缓冲 区 一 次 。 
(2) 分 配 一 个 大 到 足以 包含 两 个 缓冲 区 的 新 缓冲 区 。 将 两 个 缓冲 
区 的 内 容 复制 到 新 缓冲 区 中 。 然 后 对 这 个 新 缓冲 区 调用 一 次 write。 
(3) 调用 writev 输 出 两 个 缓冲 区 。 
20.8 廊 的 解决 方案 使 用 了 writev， 但 是 将 它 与 男 外 两 种 方法 进行 比 
较 ， 对 我 们 是 很 有 局 发 的 。 图 14-23 显 示 了 上 面 所 述 3 种 方法 的 结 


两 次 write j 2.04 2.13 0.85 8.33 13.83 
RIKER, ARIK wri 0: 1.16 0.70 4.87 9.25 
-次 writev 0.04 1.21 1.26 0.43 5.34 9.24 


图 14-23 比较 writev 和 其 他 技术 所 得 的 时 间 结 果 


用 于 测量 的 测试 程序 输出 一 个 100 字 节 的 头 文件 ， 接 着 又 输出 200 
字 太 的 数据 。 这 样 做 1 048 576 次 ， 产 生 了 一 个 300 MB 的 文件 。 该 测试 
程序 有 3 个 版 本 一 针对 图 14-23 中 的 每 一 种 测量 技术 编写 了 一 个 版 本 。 使 
用 times ( 见 8.17 节 ) 测 得 它们 在 写 操作 前 、 后 各 使 用 的 用 户 CPU 时 间 、 
系统 CPU 时 间 和 时 钟 时 间 。 这 3 个 时 间 的 单位 都 是 秒 。 

正如 我 们 所 预料 鸭 ， 调 用 两 次 write 的 系统 时 间 比 调用 一 次 write 或 
writev 的 长 ， 这 与 图 3-6 的 结果 类 似 。 

接着 要 注意 的 是 ， 在 缓冲 区 复制 后 跟随 一 个 write 所 用 的 CPU 时 间 
(用 户 时 间 加 系统 时 间 ) 要 少 于 调用 一 次 writev 所 耗费 的 CPU 时 间 。 对 
于 单一 write 的 情况 ， 我 们 先 将 用 户 层次 的 两 个 缓冲 区 复制 到 一 个 分 段 
缓冲 区 (staging buffer) ， 然 后 在 调用 write 时 内 核 将 该 分 段 缓冲 区 中 的 
数据 复制 到 其 内 部 缓冲 区 。 对 于 writev 的 情况 ， 因 为 内 核 只 需 将 数据 直 
接 复制 进 其 分 段 缓冲 区 ， 所 以 复制 工作 应 当 会 少 一 些 。 但 是 ， 对 于 这 
种 少量 数据 ， 使 用 writev 的 固定 成 本 大 于 收益 。 随 着 需 复 制 数据 的 增 
加 ， 程 序 中 复制 缓冲 区 的 成 本 也 会 增多 ， 此 时 ，writev 这 种 替代 方法 将 
更 具 吸 引力 。 

不 要 依据 图 14-23 中 的 数字 对 Linux 和 Mac OS X 之 间 的 相对 性 能 作 
过 多 的 推断 。 这 两 种 计算 机 有 很 大 差别 : 它们 有 不 同 的 处 理 器 结构 、 
不 同 数量 的 RAM 以 及 不 同 速度 的 磁盘 。 为 了 在 操作 系统 之 间 进 行 公平 
的 比较 ， 需 要 对 每 一 种 操作 系统 都 使 用 相同 的 硬件 。 


总 之 ， 应 当 用 尽量 少 的 系统 调用 次 数 来 完成 任务 。 如 果 我 们 只 写 
少量 的 数据 ， 将 会 发 现 目 己 复制 数据 然后 使 用 一 次 write 会 比 用 writev 更 
合算 。 但 也 可 能 发 现 ， 我 们 管理 自己 的 分 段 缓冲 区 会 增加 程序 额外 的 
复杂 性 成 本 ， 所 以 从 性 能 成 本 的 角度 来 看 不 合算 。 


14.7 readnAliwriten 


管道 、FIFO 以 及 某 些 设备 (FRA eA aA) 有 下 列 两 种 性 
质 o 
(1) 一 次 read 操 作 所 返回 的 数据 可 能 少 于 所 要 求 的 数据 ， 即 使 还 
没 达到 文件 尾 端 也 可 能 是 这 样 。 这 不 是 一 个 错误 ， 应 当 继 续 读 该 设 
备 o 
(2) 一 次 write 操作 的 返回 值 世 可 能 少 于 指定 输出 的 字 节 数 。 这 可 
能 是 由 某 个 因素 造成 的 ， 例 如 ， 内 核 输 出 缓冲 区 变 满 。 这 也 不 是 错 
误 ， 应 当 继 续 写 余下 的 数据 。 〈 通 第， 只 有 非 阻塞 描述 符 ， 或 捕捉 到 
一 个 信号 时 ， 才 发 生 这 种 write 的 中 途 返 回 。) 
在 读 、 写 磁 一 文件 时 从 未 见 到 过 这 种 情况 ， 除 非 文件 系统 用 完了 
空间 ， 或 者 接近 了 配额 限制 ， 不 能 将 要 求 写 的 数据 全 部 写 出 。 
通常 ， 在 读 、 写 一 个 管道 、 网 络 设 备 或 终端 时 ， 需 要 考 虚 这 些 特 
性 。 下 面 两 个 贸 数 readn 和 writen 的 功能 分 别 是 读 、 写 指定 的 N 字 蔬 数 
据 ， 并 处 理 返回 值 可 能 小 于 要 求 值 的 情况 。 这 两 个 函数 只 是 按 需 多 次 
调用 read 和 write 直至 读 、 写 了 N 字 世 数 据 。 


#include "apue.h" 


ssize t readn(int fd, void *buf, size t nbytes); 
ssize t writen(int fd, void *buf, size t nbytes); 


两 个 函数 的 返回 值 : BES SAY EN; Giu. x1 


类 似 于 本 书 很 多 实例 所 使 用 的 出 错 处 理 例 程 ， 我 们 定义 这 两 个 函 
数 的 目的 是 便于 在 后 面 实例 中 使 用 。readn 和 writen 芳 数 并 不 是 哪个 标准 
的 组 成 部 分 。 

在 要 将 数据 写 到 上 面 提 到 的 文件 类 型 上 时 ， 束 可 调用 writen， 但 是 
仅 当 事先 就 知道 要 接收 数据 的 数量 时 ， 才 调用 readn。 图 14-24 包 含 了 
readn 和 writen 的 实现 ， 在 后 面 的 实例 中 ， 我 们 还 会 用 到 。 


#include "apue.h" 


ssize t /* Read "n" bytes from a descriptor */ 
readn(int fd, void *ptr, size t n) 


size t nleft; 
Ssize t nread; 


nleft = n; 
while (nleft > 0) { 
if ((nread = read(fd, ptr, nleft)) < 0) { 
if (nleft == n) 
return(-1); /* error, return -1 */ 
else 
break; /* error, return amount read so far */ 
} else if (nread == 0) { 
break; /* EOF */ 
} 
nleft -= nread; 
ptr += nread; 
} 
return(n - nleft); /* return >= 0 */ 


} 


ssize t /* Write "n" bytes to a descriptor */ 


writen(int fd, const void *ptr, size t n) 


{ 


size t nleft; 
ssize t nwritten; 
nleft = n; 


while (nleft > 0) { 
if ((nwritten = write(fd, ptr, nleft)) < 0) { 
if (nleft == n) 
return(-1); /* error, return -1 */ 


else 
break; /* error, return amount written so far */ 
} else if (nwritten == 0) { 
break; 
} 
nleft -= nwritten; 


ptr += nwritten; 


} 


return(n - nleft); /* return >= 0 */ 


| 14-24 readn 和 writen 函 数 


注意 ， 寿 在 已 经 读 、 写 了 一 些 数 据 之 后 出 错 ， 则 这 两 个 函数 返回 
的 是 已 传输 的 数据 量 ， 而 非 错 误 。 与 此 类 似 ， 在读 时 ， 如 达到 文件 尾 
癌 ， 而 且 在 此 之 前 已 成 功 地 读 了 一 些 数据 ， 但 尚未 满足 所 要 求 的 量 ， 


则 readn 返 回 已 复制 到 调用 者 缓冲 区 中 的 字 节 数 。 


14.8 LO 


存储 映射 TO (memory-mapped I/O) 能 将 一 个 磁盘 文件 映射 到 存储 
空间 中 的 一 个 缓冲 区 上 ， 于 是 ， 当 从 缓冲 区 中 取 数 据 时 ， 就 相当 于 读 
文件 中 的 相应 字 证 。 与 此 类 似 ， 将 数据 存 入 缓冲 区 时 ， 相 应 字 市 束 目 
动 写 入 文件 。 这 样 ， 就 可 以 在 不 使 用 read 和 write 的 情况 下 执行 IO 。 

存储 映射 TO 伴随 虚拟 存储 系统 已 经 用 了 很 多 年 。1981 年 ，4.1BSD 
以 其 vread 和 vwrite 夯 数 提供 了 一 种 不 同形 式 的 存储 映射 IO。4.2BSD 中 
删除 了 这 两 个 函数 ， 试 图 替换 成 mmap 函 数 。 

{A 4.2BSD SE E E JE 1478 E E mmap EZ (原因 见 McKusick 等 
[1996] 中 2.5 市 的 描述 ) ° Gingell ^ Moran/fllShannon[1987]18 3i f mmap 
HJ— PREE « SUSvAfE mmap kK aL n] eA P Bl] T ZEAE Hn o 
所 有 的 遵循 POSIX 的 系统 都 需要 支持 它 。 

为 了 使 用 这 种 功能 ， 应 首先 告诉 内 核 将 一 个 给 定 的 文件 映射 到 一 
个 存储 区 域 中 。 这 是 由 mmap 函 数 实现 的 。 


#include <sys/mman.h> 


void *mmap(void *addr, size_t len, int prot, int flag, int fd, off_t off); 
返回 值 : ARJ, RRR Aaah; 大 出 错 ， 返 回 
MAP FAILED 
addr 参 数 用 于 指定 映射 存储 区 的 起 始 地 址 。 通 第 将 其 设置 为 0， 这 
表示 由 系统 选择 该 映射 区 的 起 始 地 址 。 此 画 数 的 返回 值 是 该 映射 区 的 
起 始 地 址 。 
fd 参数 是 指定 要 被 映射 文件 的 描述 符 。 在 文件 映射 到 地 址 空间 之 
前 ， 必 须 先 打开 该 文件 。len 参 数 是 映射 的 字 市 数 ，off 是 要 映射 字 太 在 
文件 中 的 起 始 偏 移 量 (有 关 off 值 的 一 些 限 制 将 在 后 面 说 明 ) 。 
prot 参 数 指定 了 映射 存储 区 的 保护 要 求 ， 如 图 14-25 所 示 。 


PROT READ 映射 区 可 读 


PROT WRITE 映射 区 可 写 
PROT EXEC 映射 区 可 执行 
PROT NONE 映射 区 不 可 访问 


图 14-25 映射 存储 区 的 保护 要 求 


可 将 prot 参 数 指定 为 PROT_NONE ， 也 可 指定 为 PROT_READ ` 
PROT WRITE 和 PROT_EXEC 的 任意 组 合 的 按 位 或 。 对 指定 映射 存储 
区 的 保护 要 求 不 能 超过 文件 open 模 式 访问 权限 。 例 如 ， 若 该 文件 是 只 
该 打开 的 ， 那 么 对 映射 存储 区 惑 不 能 指定 PROT_WRITE ° 

在 说 明 flag 参 数 之 前 ， 先 看 一 下 存储 映射 文件 的 基本 和 情况。 图 14- 
26 显 示 了 一 个 存储 映射 文件 。《〈 见 图 7-6 中 所 示 的 典型 进程 的 存储 器 安 
排 。) 在 此 图 中 ,，“ 起 始 地 址 ”是 mmap 的 返回 值 。 映 射 存储 区 位 于 堆 和 
栈 之 间 : 这 属于 实现 细节 ， 各 种 实现 之 间 可 能 不 同 。 

下 面 是 flag 参 数 影响 映射 存储 区 的 多 种 属性 。 

MAP FIXED 返回 值 必须 等 于 addr。 因 为 这 不 利于 可 移植 性 ， 所 以 
不 鼓励 使 用 此 标志 。 如 果 未 指定 此 标志 ， 而 且 addr 非 0， 则 内 核 只 把 
addr 视 为 在 何 处 设置 映射 区 的 一 种 建议 ， 但 是 不 保证 会 使 用 所 要 求 的 地 
址 。 将 addr 指 定 为 0 可 获得 最 大 可 移植 性 。 

在 遵循 POSIX 的 系统 中 ， 对 MAP_FIXED 标 志 的 支持 是 可 选择 的 ， 
但 遵循 XSI 的 系统 则 要 求 文 持 MAP_FIXED ° 

MAP SHARED 这 一 标志 描述 了 本 进程 对 映射 区 所 进行 的 存储 操 
作 的 配置 。 此 标志 指定 存储 操作 修改 映射 文件 ， 也 就 是 ， 存 储 操作 相 
当 于 对 该 文件 的 write。 必 须 指 定 本 标志 或 下 一 个 标志 

(MAP PRIVATE) ， 但 不 能 同时 指定 两 者 。 


MAP PRIVATE 本 标志 说 明 ， 对 映射 区 的 存储 操作 导致 创建 该 映 
射 文件 的 一 个 私有 副本 。 所 有 后 来 对 该 映射 区 的 引用 都 是 引用 该 副 
本 。 (此 标志 的 一 种 用 途 是 用 于 调试 程序 ， 它 将 程序 文件 的 正文 部 分 
映射 至 存储 区 ， 但 允许 用 户 修 改 其 中 的 指令 。 任 何 修改 只 影响 程序 文 
件 的 副本 ， 而 不 影响 原文 件 。) 


文件 的 存储 ^ 
映射 部 分 


len 


起 始 地 址 | | 


未 初始 化 的 数据 
(bss) 


| 
| 
已 初始 化 的 数据 | 
— 文件 的 存储 
低地 址 ER id 映射 部 分 B 
off " a 
图 14-26 存储 映射 文件 的 例子 
每 种 实现 都 可 能 还 有 另外 一 些 MAP_xxx 标志 值 ， 它 们 是 那 种 实现 
所 特有 的 。 详 细 情 况 请 参见 你 所 使 用 系统 的 mmap(2) 手 册页 。 


off 的 值 和 addr 的 值 (如 果 指 定 了 MAP_FIXED) 通常 被 要 求 是 系统 
虚拟 存储 页 长 度 的 倍数 。 虚 拟 存储 页 长 可 用 市 参数 _SC_PAGESIZE 或 


len 


_SC_PAGE_SIZEAMsysconf& 2% 〈 见 2.5.4 节 ) 得 到 。 因 为 off 和 addr 常 常 
指定 为 0， 所 以 这 种 要 求 一 般 并 不 重要 。 

这 一 要 求 通常 是 由 系统 实现 强加 的 。 尽 管 Single UNIX Specification 
不 再 要 求 满足 该 条 件 ， 但 是 所 有 本 书 中 讲 到 的 除了 FreeBSD 8.0 以 外 的 
所 有 平台 都 满足 了 这 一 要 求 。FreeBSD 8.0 人 允许 我 们 使 用 任意 的 地 址 对 
齐 和 偏 移 对 齐 ， 只 要 对 齐 匹 配 即 可 。 

既然 映射 文件 的 起 始 偏 移 量 受 系统 虚拟 存储 页 长 度 的 限制 ， 那 么 
如 有 果 映 射 区 的 长 度 不 是 页 长 的 整数 倍 时 ， 会 怎么 样 呢 ? 假定 文件 长 为 
12 字 节 ， 系 统 页 长 为 512 字 节 ， 则 系统 通常 提供 512 字 节 的 映射 区 ， 
其 中 后 500 字 节 被 设置 为 0。 可 以 修改 后 面 的 这 500 字 节 ， 但 任何 变动 都 

` 会 在 文件 中 反映 出 来 。 于 是 ， 不 能 用 mmap 将 数据 添加 到 文件 中 。 我 

们 必须 先 加 长 该 文件 ， 如 后 面 的 图 14-27 中 的 程序 所 示 。 

与 映射 区 相关 的 信号 有 SIGSEGV 和 SIGBUS。 信 号 SIGSEGV 通 常 
用 于 指示 进程 试图 访问 对 它 不 可 用 的 存储 区 。 如 有 果 映 射 存储 区 被 mmap 
指定 成 了 只 读 的 ， 那 么 进程 试图 将 数据 存 入 这 个 映射 存储 区 的 时 候 ， 
也 会 产生 此 信和 号。 如 果 映 射 区 的 某 个 部 分 在 访问 时 已 不 存在 ， 则 产生 
SIGBUS 信 号 。 例 如， 假设 用 文件 长 度 映 射 了 一 个 文件 ， 但 在 引用 该 映 
射 区 之 前 ， 另 一 个 进程 已 将 该 文件 截断 。 此 时 ， 如 果 进 程 试 图 访问 对 
应 于 该 文件 已 截 去 部 分 的 映射 区 ， 将 会 接收 到 SIGBUS 信 和 号。 

子 进程 能 通过 fork 继 承 存储 映射 区 (因为 子 进程 复制 父 进 程 地 址 空 
间 ， 而 存储 映射 区 是 该 地 址 空间 中 的 一 部 分 ) ， 但 是 由 于 同样 的 原 
因 ， 新 程序 则 不 能 通过 exec 继 承 存 储 映射 区 。 

调用 mprotect 可 以 更 改 一 个 现 有 了 映射 的 权限 。 


#include <sys/mman.h> 


int mprotect(void *addr, size t len, int prot); 


返回 值 : ERD, WO; 大 出 错 ， 返 回 -1 


prot 的 合法 值 与 nmap 中 prot 参 数 的 一 样 ( 见 图 14-25) 。 请 注意 ， 
地 址 参数 addr 的 值 必须 是 系统 页 长 的 整数 倍 。 

如 果 修 改 的 页 是 通过 MAP_SHARED 标 志 映 射 到 地 址 空间 的 ， 那 么 
修改 并 不 会 立即 写 回 到 文件 中 。 相 反 ， 何 时 写 回 脏 页 由 内 核 的 守护 进 
程 决定 ， 决 定 的 依据 是 系统 负载 和 用 来 限制 在 系统 失败 事件 中 的 数据 
损失 的 配置 参数 。 因 此 ， 如 果 只 修改 了 一 页 中 的 一 个 字 季 ， 当 修改 被 
写 回 到 文件 中 时 ， 整 个 页 都 会 被 写 回 。 

如 有 果 共 享 映 射 中 的 页 已 修改 ， 那 么 可 以 调用 msync 将 该 页 冲洗 到 
被 映射 的 文件 中 。msync 函 数 类 似 于 fsync 〈 见 3.13 节 ) ,但 作用 于 存储 
BRT DX e 


#include <sys/mman.h> 


int msync(void *addr, size_t len, int flags); 
返回 值 : ERD, welo; Auta, we- 

RRR AL AY, EA AMER ECE 9 Eth aR aT 
KAR, Mb 5 HDA ° 

flags 参 数 使 我 们 对 如 何冲 洗 存储 区 有 某 种 程度 的 控制 。 可 以 指定 
MS_ASYNC 标志 来 简单 地 调试 要 写 的 页 。 如 果 希 望 在 返回 之 前 等 待 写 
操作 完成 ， 则 可 指定 MS SYNC 标志 。 一 定 要 指定 MS_ASYNC 和 
MS_SYNC 中 的 一 个 。 

MS_INVALIDAIE 是 一 个 可 选 标 志 ， 人 允许 我 们 通知 操作 系统 丢弃 那 
些 与 底层 存储 絮 没 有 同步 的 页 。 奉 使 用 了 此 标志 ， 茶 些 实现 将 丢弃 指 
定 范 围 中 的 所 有 页 ， 但 这 种 行为 并 不 是 必需 的 。 

msync HAE S TE Single UNIX Specification 的 XSI 选 项 中 。 因 此 ， 
所 有 UNIX 系 统 必须 文 持 它 。 

当 进 程 终止 时 ， 会 目 动 解除 存储 映射 区 的 映射 ， 或 者 直接 调用 
munmap 函 数 也 可 以 解除 映射 区 。 关 闭 映 射 存储 区 时 使 用 的 文件 接 述 和 从 
并 不 解除 映射 区 。 


#include <sys/mman.h> 
int munmap(void *addr, size_t len); 
返回 值 : TA), allo; AES, we- 

munmap 并 不 影响 被 映射 的 对 象 ， 也 就 是 说 ， 调 用 munmap 并 不 会 
使 映射 区 的 内 容 写 到 磁盘 文件 上 。 对 于 MAP_SHARED 区 人 磁盘 文件 的 更 
新 ， 会 在 我 们 将 数据 写 到 存储 映射 区 后 的 某 个 时 刻 ， 按 内 核 虚 拟 存 储 
算法 自动 进行 。 在 存储 区 解除 映射 后 ， 对 MAP_PRIVATE 存 储 区 的 修改 
ZWERF ° 

实例 

图 14-27 中 的 程序 用 存储 映射 UO 复制 文件 (类 似 于 cp(1) 命 令 ) 。 


#include «fcntl.h» 
#include <sys/mman.h> 


#define COPYINCR (1024*1024*1024) 


int 
main(int argc, 


{ 


/* 1 GB 


char *argv[]) 


x 


int fdin, fdout; 
void *sre; *dst; 
size t COpySZ; 
struct stat sbuf; 
OLI fsz = 0; 
if (argc != 3) 
err quit("usage: $s «fromfile» «tofile»", argv[0]); 
if ((fdin = open(argv[1], O RDONLY)) « 0) 
err sys("can't open $s for reading", argv[1]) 
if ((fdout = open(argv[2], O_RDWR | O CREAT | O TRUNC, 


FILE MODE)) < 0) 
err sys("can't creat 
If 


(fstat (fdin, &sbuf) 


d 


(ftruncate(fdout, 


while 
LE 


(fsz < sbuf.st_size) 


copysz = 


« 0) 
err sys("fstat error"); 


sbuf.st size) 


err sys("ftruncate error"); 


((sbuf.st size - fsz) 
COPYINCR; 


$s for writing", 


argv[2]); 


/* need size of input file */ 


« 0) /* set output file size */ 


» COPYINCR) 


else 


copysz = 


Ea 


fdin, fs 


((src - 


sbuf.st.size = fsz; 


mmap (0, 
z)) 


copysz, 
== MAP FAILED) 


PROT_READ, MAP_SHARED, 


err_sys("mmap error for input"); 


if 


((dst = 
MAP SHARED, 


mmap (0, 
fdout, 


copysz, 
fsz)) 


PROT READ | 
== MAP FAILED) 


PROT WRITE, 


err sys("mmap error for output"); 


memcpy (dst, 
munmap (src, 


munmap (dst 


src, copysz); 
copysz); 


o COpySZ); 


fsz += copysz; 


} 
exit (0) 


ER 


/* does the file copy */ 


图 14-27 用 存储 映射 TO 复制 文件 
该 程序 首先 打开 两 个 文件 ， 


后 调用 fstat 得 到 输入 文件 的 长 度 。 在 


为 输入 文件 调用 mmap 和 设置 输出 文件 长 度 时 都 需 使 用 输入 文件 长 度 。 


可 以 调用 ftruncate 设 置 输出 文件 的 长 度 。 如 果 不 设置 输出 文件 的 长 度 ， 
则 对 输出 文件 调用 mmap 也 可 以 ， 但 是 对 相关 存储 区 的 第 一 次 引用 会 产 
生 SIGBUS 信 和 号。 

然后 对 每 个 文件 调用 mmap ， 将 文件 映射 到 内 存 ， 最 后 调用 
memcpy 将 输入 缓冲 区 的 内 容 复 制 到 输出 缓 神 区 。 为 了 限制 使 用 内 存 的 
量 ， 我 们 每 次 最 多 复制 1 GB 的 数据 (如 果 系 统 没 有 足够 的 内 存 ， 可 能 
无 法 把 一 个 很 大 的 文件 中 的 所 有 内 容 都 映射 到 内 存 中 ) 。 在 映射 文件 
中 的 后 一 部 分 数据 之 前 ， 我 们 需要 解除 前 一 部 分 数据 的 映射 。 

在 从 输入 缓冲 区 (src) 取 数 据 字 节 时 ， 内 核 自 动 读 输 入 文件 ; 在 
将 数据 存 入 输出 绥 冲 区 (dst) 时 ， 内 核 自动 将 数据 写 到 输出 文件 中 。 

数据 被 写 到 文件 的 确切 时 间 依 赖 于 系统 的 页 管理 算法 。 某 些 系 统 
设置 了 守护 进程 ， 在 系统 运行 期 间 ， 它 慢 条 斯 理 地 将 改写 过 的 页 写 到 
磁盘 上 “。 如 果 想 要 确保 数据 安全 地 写 到 文件 中 ， 则 需 在 进程 终止 前 以 
MS_SYNC 标 志 调 用 msync。 

将 存储 区 映射 复制 与 用 read 和 write 进行 的 复制 (缓冲 区 长 度 为 8 
192) 相 比 较 ， 得 到 图 14-28 中 所 示 的 结果 。 其 中 ， 时 间 单 位 是 秒 ， 被 复 
制 文件 的 长 度 是 300 MB。 注 意 ， 我 们 并 没有 在 退出 前 将 数据 同步 到 磁 
Ft o 


Linux 3.2.0 (Intel x86) Solaris 10 (SPARC) 


操作 


read/write 


mmap/memcpy 


图 14-28 read/write 与 mmap/memcpy 比 较 的 时 间 结 果 


在 Linux 3.2.0 和 Solaris 10 中 ， 两 种 方法 的 总 的 CPU 时 间 (用 户 时 间 
+ 系统 时 间 ) 几乎 是 相同 的 。 在 Solaris 中 ， 使 用 mmap 和 memcpy 复 制 , 
与 使 用 read 和 write 相 比 ， 花 费 了 更 多 的 用 户 时 间 ， 但 却 减 少 了 系统 时 
间 。 在 Linux 中 ， 用 户 时 间 的 结果 很 相似 ， 但 是 用 read 和 write 消 耗 的 系 


统 时 间 要 比 使 用 mmap 和 memcpy 略 好 一 些 。 这 两 种 版 本 的 方法 是 殊 途 
[E] UHR ° 

二 者 的 主要 区 别 在 于 ， 与 mmap 和 memcpy 相 比 ，read 和 write 执行 了 
更 多 的 系统 调用 ， 并 做 了 更 多 的 复制 。read 和 write 将 数据 从 内 核 缓 冲 区 
中 复制 到 应 用 缓冲 区 (read) ， 然 后 再 把 数据 从 应 用 绥 冲 区 复制 到 内 核 
缓冲 区 (write) 。 而 mmap 和 memcpy 则 直接 把 数据 从 映射 到 地 址 空间 
的 一 个 内 核 缓冲 区 复制 到 男 一 个 内 核 缓冲 区 。 当 引用 尚 不 存在 的 内 存 
页 时 ， 这 样 的 复制 过 程 就 会 作为 处 理 页 错误 的 结果 而 出 现 (每 次 错 页 
读 发 生 一 次 错误 ， 每 次 错 页 写 发 生 一 次 错误 ) 。 如 果 系 统 调用 和 额外 
的 复制 操作 的 开销 和 页 错误 的 开 峭 不 同 ， 那 么 这 两 种 方法 中 就 会 有 一 
种 比 男 一 种 表现 更 好 。 

在 Linux 3.2.0 中 ， 相 对 于 运行 时 间 ， 两 种 版 本 的 程序 在 时 钟 时 间 上 
显示 出 了 巨大 的 差异 : 使 用 read 和 write 的 版 本 完成 任务 比 使 用 mmap 和 
memcpy 的 版 本 快 了 4 倍 。 然 而 在 Solaris 10 中 ， 使 用 mmap 和 memcpy 的 
版 本 比 使 用 read 和 write 的 版 本 要 快 。 既 然 二 者 的 CPU 时 间 儿 乎 是 相同 
的 ， 为 何 它们 的 时 钟 时 间 差 异 却 如 此 之 大 呢 ? 一 种 可 能 是 ， 在 一 种 版 
本 中 需要 较 长 的 时 间 来 等 待 WO 完 成 。 这 个 等 得 时 间 并 没有 计算 在 CPU 
的 处 理 时 间 中 。 男 一 种 可 能 是 ， 某 些 系 统 处 理 的 时 间 可 能 并 没有 在 程 
序 中 计算 ， 比 如 系统 守护 进程 把 页 写 到 磁盘 中 的 操作 。 由 于 需要 为 读 
和 写 分 配 页 ， 系 统 的 守护 进程 会 帮助 我 们 准备 可 用 的 页 。 如 采 页 的 写 
操作 是 随机 的 而 非 连续 的 ， 那 么 把 它们 写 入 磁盘 所 需要 的 时 间 会 更 
长 ， 因 此 在 页 可 以 被 用 来 复 用 之 前 所 需 等 待 的 时 间 也 会 更 长 。 

有 的 系统 将 一 个 普通 文件 复制 到 另 一 个 普通 文件 中 时 ， 存 储 映射 
IO 可 能 会 比较 快 。 但 是 有 一 些 限 制 ， 例 如 ， 不 能 用 这 种 技术 在 某 些 设 
备 之 间 (如 网 络 设 备 或 终端 设备 ) 进行 复制 ， 并 且 在 对 被 复制 的 文件 
进行 映射 后 ， 也 要 注意 该 文件 的 长 度 是 否 改变 。 尽 管 如 此 ， 某 些 应 用 
程序 仍然 能 得 益 于 存储 映射 TO， 因 为 它 处 理 的 是 存储 空间 而 不 是 读 、 


写 一 个 文件 ， 所 以 常常 可 以 人 简化 算法 。 从 存储 映射 WO 中 得 益 的 一 个 例 
子 是 对 帧 缓冲 设备 的 操作 ， 该 设备 引用 位 图 式 显 示 (bit-mapped 
display) ° 

Krieger、Stumm 和 Unrau[1992] 撒 述 了 一 个 使 用 存储 映射 TO 的 标准 
IO 库 〈 见 第 5 章 ) ° 

15.9 方 还 会 提 到 存储 映射 IO， 其 中 还 举 了 一 个 例子 ， 说 明 如 何 使 
用 存储 映射 TO 在 两 个 相关 进程 间 提 供 共享 存储 区 。 


14.9 小 结 


本 章 描述 了 很 多 高 级 MO 功能 ， 其 中 有 许多 将 用 在 后 面 章节 的 实例 
中 o 

。 非 阻塞 IO 一 发 一 个 IO 操作 ， 不 使 其 阻塞 。 

ARKA (在 第 20 章 中 有 一 个 实例 ， 该 实例 会 对 此 进行 更 详细 的 讨 
沦 ) 。 
。I/O 多 路 转 接 一 select 和 poll 范 数 (在 后 面 的 很 多 实例 中 会 用 到 这 两 
个 函数 ) 。 

° readv Ñi writev EX Zt — 〈 在 后 面 的 很 多 实例 中 也 会 用 到 这 两 个 画 


数 ) 。 
“存储 映射 IO (mmap) 9 
习题 


14.1 编写 一 个 测试 程序 说 明 你 所 用 系统 在 下 列 情况 下 的 运行 情 
况 : 一 个 进程 在 试图 对 一 个 文件 的 某 个 玫 围 加 写 锁 的 时 候 阻 塞 ， 之 后 


其 他 进程 又 提出 了 一 些 相关 的 加 读 锁 请 求 。 试 图 加 写 锁 的 进程 会 不 会 
ER IU PC? 

14.2 查看 你 所 用 系统 的 头 文 件 ， 并 研究 select 和 4 个 FD_ 宏 的 实现 。 

14.3 系统 头 文件 通常 对 fd. set 数据 类 型 可 以 处 理 的 最 大 描述 符 数 
有 一 个 内 置 的 限制 ， 假 设 需要 将 描述 符 数 增加 到 2 048， 该 如 何 实 现 ? 

14.4 比较 处 理 信号 量 集 的 函数 〈 见 10.11 节 ) 和 处 理 fd_set 描 述 符 集 
的 函数 ， 并 比较 这 两 类 函数 在 你 系统 上 的 实现 。 

14.5 用 select 或 poll 实 现 一 个 与 sleep 类 似 的 函数 sleep_us， 不 同 之 处 
是 要 等 待 指定 的 若干 微 秒 。 比 较 这 个 函数 和 BSD 中 的 usleep 函 数 。 

14.6 是 否 可 以 利用 建议 性 记录 锁 来 实现 图 10-24 H B5 Ex ZR 
TELL_WAIT ` TELL_PARENT ` TELL_CHILD ` WAIT. PARENT Ll X 
WAIT. CHILD? 如 果 可 以 ， 编 写 这 些 函 数 并 测试 其 功能 。14.7 用 非 阻 
塞 写 来 确定 管道 的 容量 。 将 其 值 与 第 2 章 的 PIPE_BUF 值 进行 比较 。 

14.8 重 写 图 14-21 中 的 程序 来 制作 一 个 过 滤器 : 从 标准 输入 中 读 入 
并 向 标准 输出 写 ,但 是 要 使 用 异步 WO 接口 。 为 了 使 之 能 正常 工作 ， 你 
都 需要 修改 些 什么 ? 记 住 ， 无 论 你 的 标准 输出 被 连接 到 终端 、 管 道 还 
是 一 个 普通 文件 ， 都 应 该 得 到 相同 的 结 

14.9 回忆 图 14-23， 在 你 的 系统 上 找到 一 个 损益 平衡 点 ， 从 此 点 开 
始 ， 使 用 writev 将 快 于 你 自己 使 用 单个 write 复制 数据 。 

14.10 运行 图 14-27 中 的 程序 复制 一 个 文件 ， 检 查 输入 文件 的 上 一 次 
访问 时 间 是 否 更 新 了 ? 

14.11 在 图 14-27 的 程序 中 ， 在 调用 mmap 后 调用 close 关 闭 输 入 文 
件 ， 以 验证 关闭 描述 符 不 会 使 内 存 上 映射/O 失 效 。 


15.1 引言 


第 8 章 说 明了 进程 控制 原 语 ， 并 且 观 察 了 如 何 调用 多 个 进程 。 但 是 
这 些 进程 之 间 交 换 信 息 的 唯一 途径 就 是 传送 打开 的 文件 ， 可 以 经 由 fork 
或 exec 来 传送 ， 也 可 以 通过 文件 系统 来 传送 。 本 章 将 说 明 进 程 之 间 相 互 
通信 的 其 他 技术 一 进程 间 通 信 (InterProcess Communication, IPC) 。 

过 去 ，UNIX 系 统 IPC 是 各 种 进程 通信 方式 的 统称 ， 但 是 ， 这 些 通 
信 方 式 中 极 少 有 能 在 所 有 UNIX 系 统 实现 中 进行 移植 的 。 随 着 POSIX 和 
The Open Group (以 前 是 X/Open) 标准 化 的 推进 和 影响 的 扩大 ， 人 情况 
已 得 到 改善 ， 但 差别 仍然 存在 。 图 15-1 摘 要 列 出 了 本 书 讨论 的 4 种 实现 
所 支持 的 不 同形 式 的 IPC 。 


IPC 类 型 SUS FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 Solaris 10 


XSI 消息 队列 
XSI 信号 量 
XSI 共享 存储 
消息 队列 《实时 ) | MSG 选项 
信号 量 . 


共享 存储 〈 实 时 ) | SHM 选项 


套 接 字 . 
STREAMS 废弃 的 


图 15-1 UNIX 系 统 IPC 摘 要 

注意 ， 虽 然 Single UNIX Specification (“SUS” 列 ) 要 求 的 是 半 双 工 
管道 ， 但 允许 实现 支持 全 双 工 管道 。 即 使 应 用 程序 在 编写 时 假定 基础 
操作 系统 只 支持 半 双 工 管道 ， 支 持 全 双 工 管道 的 实现 也 能 用 这 种 应 用 
程序 正常 工作 。 图 中 使 用 “ (全 ) ”表示 用 全 双 工 管道 支持 半 双 工 管 道 
的 实现 。 

在 图 15-1 中 ， 我 们 在 支持 基本 功能 的 位 置 处 标注 了 一 个 黑 点 。 对 于 
全 双 工 管道 ， 如 果 该 特征 是 经 由 UNIX 域 套 接 字 (UNIX domain 
socket, J17.277) 支持 的 ， 则 在 相应 列 中 标注 “UDS”。 某 些 实现 用 管 
道 和 UNIX 域 套 接 字 来 支持 该 特征 ， 所 以 这 些 位 置 上 标 有 “。` UDS” ° 

IPC 接 口 作 为 POSIX.1 实 时 扩展 的 一 部 分 ， 也 是 Single UNIX 
Specification 中 的 选项 。 在 SUSv4 中 ， 信 和 号 量 接口 从 可 选 规范 移 到 了 基 
本 规范 中 。 

虽然 命名 全 双 工 管道 作为 被 挂 载 的 基于 STREAMS 的 管道 使 用 ， 但 
是 Single UNIX Specification 将 它 标记 成 弃 用 的 。 

尽管 Linux 中 OpenSS7 项 H AY “Linux Fast-STREAMS” £&, x f$ 
STREAMS， 但 是 这 个 包 最 近 都 没有 更 新 。 从 2008 年 以 来 最 新 的 包 版 本 
只 到 内 核 版 本 2.6.26。 

图 15-1 中 前 10 种 IPC 形 式 通 常 限 于 同一 台 主 机 的 两 个 进程 之 间 的 
IPC ° RENT ( 套 接 字 和 STREAMS) 是 仅 有 的 支持 不 同 主机 上 两 个 
进程 之 间 IPC 的 两 种 形式 。 

我 们 将 与 IPC 有 关 的 讨论 分 成 3 章 。 本 章 讨论 经 典 的 IPC: 管道 、 
FIFO、 消 息 队 列 、 信 号 量 以 及 共 至 存储 。 下 一 章 讨 论 使 用 套 接 字 机 制 
的 网 络 IPC。 第 17 章 说 明 IPC 的 某 些 高 级 特征 。 


15.2 管道 


管道 是 UNIX 系 统 IPC 的 最 古老 形式 ， 所 有 UNIX 系 统 都 提供 此 种 通 
信 机 制 。 管 道 有 以 下 两 种 局 限 性 。 

(1) 历史 上 ， 它 们 是 半 双 工 的 《〈 即 数据 只 能 在 一 个 方向 上 流 
动 ) 。 现 在 ， 某 些 系统 提供 全 双 工 管道 ， 但 是 为 了 最 佳 的 可 移植 性 ， 
我 们 决 不 应 预先 假 定 系统 支持 全 双 工 管道 。 

(2) 管道 只 能 在 具有 公共 祖先 的 两 个 进程 之 间 使 用 。 通 常 ， 一 个 
管道 由 一 个 进程 创建 ， 在 进程 调用 fork 之 后 ， 这 个 管道 就 能 在 父 进 程 和 
子 进程 之 间 使 用 了 。 

我 们 将 会 看 到 FIFO ( 见 15.5 节 ) 没有 第 二 种 局 限 性 ，UNIX 域 套 接 
F 〈 见 17.2 节 ) 没有 这 两 种 局 限 性 。 

尽管 有 这 两 种 局 限 性 ， 半 双 工 管道 仍 是 最 常用 的 IPC 形 式 。 每 当 在 
管道 中 键入 一 个 命令 序列 ， 让 shell 执行 时 ，shell 都 会 为 每 一 条 命令 单 
独创 建 一 个 进程 ， 然 后 用 管道 将 前 一 条 命令 进程 的 标准 输出 与 后 一 条 
命令 的 标准 输入 相连 接 。 

管道 是 通过 调用 pipe 函 数 创 建 的 。 

#include <unistd.h> 


int pipe(int fd[2]); 


返回 值 ， 若 成 功 ， 返 回 9， 若 出 错 ， 返 回 -1 

经 由 参数 fd 返回 两 个 文件 描述 符 ，fd[0] 为 读 而 打开 ，fd[1] 为 写 而 
打开 。fd[1] 的 输出 是 fd[0] 的 输入 。 

最 初 在 4.3BSD 和 4.4BSD 中 ， 管 道 是 用 UNIX 域 套 接 字 实 现 的 。 嘲 
然 UNIX 域 套 接 字 默 认 是 全 双 工 的 ， 但 这 些 操作 系统 阻碍 了 用 于 管道 的 
套 接 字 ， 以 至 于 这 些 管道 只 能 以 半 双 工 模式 操作 。 

POSIX.1 人 允许 实现 支持 全 双 工 管道 。 对 于 这 些 实现 ，fd[0] 和 fd[1] 以 
读 / 写 方式 打开 。 

图 15-2 中 给 出 了 两 种 描绘 半 双 工 管道 的 方法 。 左 图 显示 管道 的 两 端 
在 一 个 进程 中 相互 连接 ， 右 图 则 强调 数据 需要 通过 内 核 在 管道 中 流 


BH o 

fstat 函 数 〈 见 4.2 节 ) 对 管道 的 每 一 端 都 返回 一 个 FIFO 类 型 的 文件 
描述 符 。 可 以 用 S_ISFIFO 宏 来 测试 管道 。 

POSIX.1 规 定 stat 结 构 的 st_size 成 员 对 于 管道 是 未 定义 的 。 但 是 当 
fstat 函 数 应 用 于 管道 读 端 的 文件 描述 符 时 ， 很 多 系统 在 st_size 中 存储 管 
道中 可 用 于 读 的 字 节 数 。 但 是 ， 这 是 不 可 移植 的 。 


用 户 进 程 用 户 进程 


或 者 


fd[0]  fd[1] £d[0] 


£d[1] 


图 15-2 描绘 半 双 工 管道 的 两 种 方法 

单个 进程 中 的 管道 几乎 没有 任何 用 处 。 通 第 ， 进 程 会 完 调用 pipe， 
接着 调用 fork， 从 而 创建 从 父 进 程 到 子 进程 的 IPC 通 道 ， 反 之 亦 然 。 图 
15-3 显 示 了 这 种 情况 。 


父 进程 子 进程 


fd[0]  fd[1] fd[0]  fd[1] 


WE 


图 15-3 fork 之 后 的 半 双 工 管道 

fork 之 后 做 什么 取决 于 我 们 想 要 的 数据 流 的 方向 。 对 于 从 父 进 程 

到 子 进 程 的 管道 ， 父 进程 关闭 管道 的 读 端 (fap ， 子 进程 关闭 写 端 
(fd[1]) 。 图 15-4 显 示 了 在 此 之 后 描述 符 的 状态 结果 o 


父 进程 子 进程 


内 核 


图 15-4 从 父 进程 到 子 进 程 的 管道 


对 于 一 个 从 子 进程 到 父 进 程 的 管道 ， 父 进程 天 闭 fd[1]， 子 进程 天 
4] fd[0] 。 

当 管 道 的 一 端 被 天 闭 后 ， 下 列 两 条 规则 起 作用 * 

(1) 当 读 (read) 一 个 写 端 已 被 关闭 的 管道 时 ， 在 所 有 数据 都 被 
读 取 后 ，read 返 回 9， 表 示 文 件 结 束 。 (从 技术 上 来 讲 ， 如 果 管 道 的 写 
端 还 有 进程 ， 就 不 会 产生 文件 的 结束 。 可 以 复制 一 个 省 道 的 摘 述 符 ， 
使 得 有 多 个 进程 对 它 具 有 写 打 开 文 件 措 述 符 。 人 但是， 通常 一 个 管道 只 
有 一 个 读 进 程 和 一 个 写 进程 。 下 一 方 介绍 FIFO 时 ， 会 看 到 对 于 单个 的 
FIFO 常 常 有 多 个 写 进 程 。) 

(2) 如 果 写 (write) 一 个 读 端 已 被 关闭 的 管道 ， 则 产生 信和 号 
SIGPIPE。 如 果 忽 略 该 信号 或 者 捕捉 该 信号 并 从 其 处 理 程序 返回 ， 则 
writeik[H]|-1, ermoix B NEPIPE ° 


在 写 管道 (或 FIFO) 时 ， 常 量 PIPE BUF 规定 了 内 核 的 管道 缓冲 
区 大 小 。 如 果 对 管道 调用 write ， 而 且 要 求 写 的 字 节 数 小 于 等 于 
PIPE_BUF， 则 此 操作 不 会 与 其 他 进程 对 同一 管道 〈 或 FIFO) 的 write 
操作 交叉 进行 。 但 是 ， 若 有 多 个 进程 同时 写 一 个 管道 (或 FIFO) ， 而 
且 我 们 要 求 写 的 字 节 数 超过 PIPE_BUF， 那 么 我 们 所 写 的 数据 可 能 会 所 
其 他 进程 所 写 的 数据 相互 交叉 。 用 pathconf 或 fpathconf 函 数 ( 见 图 2- 
12) 可 以 确定 PIPE_BUF 的 值 。 

实例 

图 15-5 程序 创建 了 一 个 从 父 进 程 到 子 进程 的 管道 ， 并 且 父 进程 经 
由 该 管道 向 子 进程 传送 数据 。 


#include "apue.h" 


unt 
main(void) 


{ 


int n; 

dnt fd[2]; 

pid t pid; 

char line[MAXLINE]; 


if (pipe(fd) « 0) 
err sys("pipe error"); 
if ((pid = fork()) « 0) { 
err_sys("fork error"); 
} else if (pid > 0) { /* parent */ 
close (fd[0]); 
write(fd[1], "hello world\n", 12); 
) else { /* child */ 
close(fd[1]); 
n = read(fd[0], line, MAXLINE); 
write(STDOUT FILENO, line, n); 
} 
exit (0); 


图 15-5 经 由 管道 从 父 进程 向 子 进程 传送 数据 
注意 ， 这 里 的 管道 方向 和 图 15-4 中 的 是 一 致 的 。 
在 上 面 的 例子 中 ， 直 接 对 管道 插 述 符 调 用 了 read 和 write。 更 有 趣 的 
征 将 管道 描述 符 复 制 到 了 标准 输入 或 标准 输出 上 。 通 前 ， 子 进程 会 在 


此 之 后 执行 另 一 个 程序 ， 该 程序 或 者 从 标准 输入 (已 创建 的 管道 ) 读 
数据 ， 或 者 将 数据 写 至 其 标准 输出 (该 管道 ) 。 

实例 

试 着 编写 一 个 程序 ， 其 功能 是 每 次 一 页 地 显示 已 产生 的 输出 。 已 
经 有 很 多 UNIX 系 统 公 用 程序 具有 分 页 功能 ， 因 此 无 需 再 构造 一 个 新 的 

分 页 程序 ， 只 要 调用 用 户 最 喜爱 的 分 页 程 | 就 可 以 了 。 o y p mE IC 

所 有 数据 写 到 一 个 临时 文件 中 ， 然 后 再 调用 系统 中 有 关 程 序 显示 该 文 
件 ， 我 们 希望 通过 管道 将 输出 直接 送 到 分 页 程序 。 为 此 ， 先 创建 一 个 
管道 ，fork 一 个 子 进程 ， 使 子 进程 的 标准 输入 成 为 管道 的 读 端 ， 然 后 
调用 exec， 执 行 用 的 分 页 程序 。 图 15-6 中 的 程序 显示 了 如 何 实现 这 些 操 
作 。 (本 例 要 求 在 命令 行 中 有 一 个 参数 指定 要 显示 的 文件 的 名 称 。 通 
常 ， 这 种 类 型 的 程序 要 求 在 终端 上 显示 的 数据 已 经 在 存储 器 中 了 。) 


finclude "apue.h" 
#include <sys/wait.h> 


#define DEF_PAGER "/bin/more" /* default pager program */ 
int 


main(int argc, char *argv[]) 


{ 


int n; 

int Ed.[21.5 

pid t pid; 

char *pager, *argv0; 
char line[MAXLINE]; 
FILE *fp; 


if (argc != 2) 
err quit("usage: a.out <pathname>") ; 


if ((fp = fopen(argv[1], "r")) == NULL) 
err sys("can't open $s", argv[1]); 
if (pipe(fd) « 0) 
err sys("pipe error"); 


if ((pid = fork()) « 0) ( 
err sys("fork error"); 

) else if (pid > 0) { /* parent */ 
close(fd[01); /* close read end */ 


/* parent copies argv[1] to pipe */ 


while (fgets(line, MAXLINE, fp) !- NULL) ( 
n = strlen (line); 
if (write(fd[1], line, n) != n) 


err sys("write error to pipe"); 
} 
if (ferror (fp) ) 
err_sys("fgets error"); 


close(fd[1]); /* close write end of pipe for reader */ 


if (waitpid(pid, NULL, 0) « 0) 
err sys("waitpid error"); 


exit(0); 
) else ( /* child */ 
close (fd[1]); /* close write end */ 
if (fd[0] != STDIN FILENO) { 
if (dup2(fd[0], STDIN FILENO) != STDIN FILENO) 


err sys("dup2 error to stdin"); 
close(fd[0]); /* don't need this after dup2 */ 


} 


/* get arguments for execl() */ 
if ((pager = getenv("PAGER")) == NULL) 
pager = DEF_PAGER; 
if ((argvO = strrchr(pager, '/')) != NULL) 
argvOt++; /* step past rightmost slash */ 
else 
argv0 = pager; /* no slash in pager */ 


if (execl(pager, argv0O, (char *)0) < 0) 
err sys("execl error for $s", pager); 
} 
exit (0); 


图 15-6 将 文件 复制 到 分 页 程序 


在 调用 fork 之 前 ， 先 创建 一 个 管道 。 调 用 fork 之 后 ， 父 进程 关闭 其 
读 问 ， 子 进程 天 闭 其 写 端 。 然 后 子 进程 调用 dup2， 使 其 标准 输入 成 为 
管道 的 读 端 。 当 执行 分 页 程序 时 ， 其 标准 输入 将 是 管道 的 读 端 。 

将 一 个 描述 符 复 制 到 另 一 个 上 (在 子 进程 中 ，fd[0] 复 制 到 标准 输 
A) ， 在 复制 之 前 应 当 比 较 该 描述 符 的 值 是 否 已 经 具有 所 希望 的 值 。 
如 果 该 描述 符 已 经 具有 所 和 希望 的 值 ， 并 且 调 用 了 dup2 和 close， 那 么 该 
描述 符 的 副本 将 关闭 。 《回忆 3.12 节 中 所 述 ， 当 dup2 中 的 两 个 参数 值 相 
等 时 的 操作 。) 在 本 程序 中 ， 如 果 shell 没 有 打开 标准 输入 ， 那 么 程序 
开始 处 的 fopen 应 已 使 用 摘 述 符 0， 也 就 是 最 小 未 使 用 的 描述 符 ， 所 以 
fd[0] 决 不 会 等 于 标准 输入 。 尽 管 如 此 ， 无 论 何 时 调用 dup2 和 close 将 一 
个 描述 符 复 制 到 另 一 个 上 ， 作 为 一 种 保护 性 的 编程 措施 ， 都 要 先 将 两 
个 摘 述 符 进 行 比较 。 

请 注意 ， 我 们 是 如 何尝 试 使 用 环境 变量 PAGER 获得 用 户 分 页 程序 
名 称 的 。 如 有 果 这 种 操作 没有 成 功 ， 则 使 用 系统 默认 值 。 这 是 环境 变量 
的 常见 用 法 。 

实例 

回忆 8.9 节 中 的 5 个 函数 : TELL WAIT ^ TELL. PARENT ^ 
TELL_CHILD、WAIT_PARENT 和 WAIT_CHILD。 图 10-24 中 提供 了 一 


个 使 用 信号 的 实现 。 图 15-7 则 提供 了 一 个 使 用 管道 的 实现 。 


#include "apue.h" 
static int pfíd1[2], pfd2[2]; 


void 
TELL WAIT (void) 
{ 
if (pipe(pfdl) < 0 || pipe(pfd2) < 0) 
err_sys("pipe error"); 


void 
TELL PARENT (pid t pid) 
{ 
if (write(p£d2[1], "c", I) !e 1) 


err sys("write error"); 


void 
WAIT PARENT (void) 
{ 


char c; 


if (read(pfd1[0], &c, 1) != 1) 
err_sys ("read error"); 


if (c I= 'p') 
err quit("WAIT PARENT: incorrect data"); 


void 
TELL CHILD(pid t pid) 
{ 
if (write(pfdl[1], "p", 1) != 1) 
err sys("write error"); 


void 
WAIT CHILD (void) 


{ 
char (oi 


if (read(pfd2[0], &c, 1) != 1) 
err_sys ("read error"); 


IF (e. dE er) 
err quit("WAIT CHILD: incorrect data"); 


图 15-7 让 父 进程 和 子 进 程 同 步 的 例 程 

如 图 15-8 中 所 示 ， 我 们 在 调用 fork 之 前 创建 了 两 个 管道 。 父 进程 在 
调用 TELL_CHILD 时 ， 经 由 上 一 个 管道 写 一 个 字符 “p”， 子 进程 在 调用 
TELL _PARENT 时 ， 经 由 下 一 个 管道 写 一 个 字符 “c”。 相 应 的 
WAIT_XXX 函 数 调用 read 读 一 个 字符 ， 没 有 读 到 字符 时 则 阻塞 (休眠 


等 待 ) 。 
pfd1[1] pfd1[0] 


pfd2[0] pfd2[1] 


图 15-8 用 两 个 管道 实现 父 进 程 和 子 进 程 同步 

注意 ， 每 一 个 管道 都 有 一 个 额外 的 读 取 进 程 ， 这 没有 关系 。 也 束 
征 说 ， 除 了 子 进 程 从 pfd1[0] 读 取 ， 父 进程 也 有 上 一 个 管道 的 读 端 。 
为 父 进程 并 没有 执行 对 该 管道 的 读 操作 ， 所 以 这 不 会 影响 我 们 。 


15.3 图 数 popen 和 pclose 


常见 的 操作 是 创建 一 个 连接 到 男 一 个 进程 的 管道 ， 然 后 读 其 输出 
或 癌 其 输入 端 发 送 数据 ， 为 此 ， 标 准 IO 库 提供 了 两 个 函数 popen 和 
pclose。 这 两 个 函数 实现 的 操作 是 : 创建 一 个 管道 ，fork 一 个 子 进 程 ， 
关闭 未 使 用 的 管道 端 ， 执 行 一 个 shell 运 行 命令 ， 然 后 等 待命 令 终止 。 
#include <stdio.h> 


FILE *popen(const char *cmdstring, const char *type); 


返回 值 ， 奉 成 功 ， 返 回 文件 指针 ， 大 出 错 ， 返 回 NULL 


int pclose(FILE *fp); 
返回 值 : 若 成 功 ， 返 回 cmdstring 的 终止 状态 ;， 若 出 错 ， 返 回 -1 
函数 popen 先 执行 fork， 然 后 调用 exec 执 行 cmdstring， 并 且 返 回 一 


个 标准 WO 文件 指针 。 如 果 type 是 "r"， 则 文件 指针 连接 到 cmdstring 的 标 
准 输出 ( 见 图 15-9) e 


如 果 type 是 "w"， 则 文件 指针 连接 到 cmdstring 的 标准 输入 ， 如 图 15- 
10 所 示 。 


父 进 程 cmdstring ( 子 进程 ) 


图 15-9 执行 fp = popen 


(cmdstring, "r") 的 结 采 


cmdstring ( 子 进程 ) 


图 15-10 执行 fp = popen 
(cmdstring, "w") 的 结果 
有 一 种 方法 可 以 帮助 我 们 记 住 popen 的 最 后 一 个 参数 及 其 作用 ， 这 


就 是 与 fopen 进 行 类 比 。 如 果 type 是 "r"， 则 返回 的 文件 指针 是 可 读 的 ， 
如 果 type 是 "w"， 则 是 可 写 的 。 


palose 画 数 关闭 标准 1O 流 等 待命 令 终 止 ， 然 后 返回 shell 的 终止 状 
态 。 (我 们 曾 在 8.6 节 中 描述 过 J 终止 状态 8.13 D TRU] system 函数 也 


返回 终止 状态 。) 如 果 shell 不 能 被 执行 ， 则 pclose 返 回 的 终止 状态 与 
shell 已 执行 exit(127) 一 样 。 


cmdstring 由 Bourne shell 以 下 列 方式 执行 


sh -c cmdstring 


这 表示 shell 将 扩展 cmdstring 中 的 任何 特殊 字符 。 例 如 ， 可 以 使 


fp = popen("ls *.c" , "r"); 

或 者 

fp = popen("cmd 2>&1" , "r"); 

实例 

用 popen 重 写 图 15-6 中 的 程序 ， 其 结果 如 图 15-11 所 示 。 


#include "apue.h" 
#include <sys/wait.h> 


#define PAGER "S(PAGER:-morej" /* environment variable, or default */ 


int 


main(int argc, char *argv[]) 


char line [MAXLINE]; 
FILE *fpin, *fpout; 


if (argc != 2) 
err quit ("usage: a.out <pathname>"); 
if ((fpin = fopen(argv[1], "r")) == NULL) 
err sys("can't open $s", argv[1]); 


if ((fpout = popen(PAGER, "w")) == NULL) 
err sys("popen error"); 


/* copy argv[1] to pager */ 

while (fgets(line, MAXLINE, fpin) != NULL) { 
if (fputs(line, fpout) == EOF) 

err_sys("fputs error to pipe"); 

} 

if (ferror(fpin) ) 
err_sys("fgets error"); 

if (pclose(fpout) == -1) 
err_sys("pclose error"); 


exit (0); 


图 15-11 用 popen 向 分 页 程序 传送 文件 


使 用 popen 减 少 了 需要 编写 的 代码 量 。 
shell 命令 ${PAGER:-more} 的 意思 是 : 如 果 shell 变 量 PAGER 已 经 定 
义 ， 且 其 值 非 宝 ， 则 使 用 其 值 ， 否 则 使 用 字符 串 more。 
实例 : 函数 popen 和 pclose 
图 15-12 中 的 程序 是 我 们 编写 的 popen 和 pclose。 
#include "apue .hy" 
#include <errno.h> 
#include <fcntl.h> 
#include <sys/wait.h> 
/* 
* Pointer to array allocated at run-time. 


*y 
Static pid t *childpid = NULL; 


/* 

* From our open max(), {Figure 2.17}. 
ui 

static int maxfd; 

FILE * 


popen(const char *cmdstring, const char *type) 


{ 


int 3n 


int pfd[2]; 
pid-t pid? 
FILE *fp; 


/* only allow "r" or "w" */ 

if ((type[0] != 'r' && type[0] != 'w') || type[1] != 0) ( 
errno = EINVAL; 
return (NULL) ; 


if (childpid == NULL) { /* first time through */ 
/* allocate zeroed out array for child pids */ 
maxfd = open_max(); 
if ((childpid = calloc(maxfd, sizeof (pid_t))) == NULL) 
return (NULL); 


if (pipe(pfd) « 0) 
return(NULL); /* errno set by pipe() */ 
if (pfd[0] >= maxfd || pfd[1] >= maxfd) { 
close (pfd[0]); 
close (pfd[1]); 
errno - EMFILE; 
return (NULL); 


if ((pid = fork()) « 0) { 
return(NULL); /* errno set by fork() */ 


) else if (pid == 0) { /* iad «P 
if (*type == 'r') { 
close (pfd[0]); 
if (pfd[1] != STDOUT FILENO) { 


dup2(pfd[1], STDOUT FILENO); 
close (pfd[1]); 

} 

} else { 

close (pfd[1]); 

if (pfd[0] != STDIN FILENO) { 
dup2 (pfd[0], STDIN FILENO); 
close (pfd[0]); 


/* close all descriptors in childpid[] */ 


for (i = 0; i « maxfd; i++) 
if (childpid[i] » 0) 
close(i); 
execl("/bin/sh", "sh", "-c", cmdstring, (char *)0); 


_exit (127); 


/* parent continues... */ 
if (*type == 'r') ( 


153 K% popen All pclose 
close(pfd[1]); 


if ((fp = fdopen(pfd[0], type)) == NULL) 
return (NULL) ; 
} else { 
close (pfd[0]); 
if ((fp = fdopen(pfd[1], type)) == NULL) 


return (NULL) ; 


childpid[fileno(fp)] = pid; /* remember child pid for this fd */ 
return (fp); 


int 

pclose (FILE *fp) 

{ 
int fd, stat; 
pid t pid; 


if (childpid == NULL) { 
errno = EINVAL; 
return(-1); /* popen() has never been called */ 


fd = fileno(fp); 
if (fd >= maxfd) { 
errno = EINVAL; 


return(-1); /* invalid file descriptor */ 
} 
if ((pid = childpid[fd]) == 0) { 
errno = EINVAL; 
return (-1); /* fp wasn't opened by popen() */ 


childpid[fd] = 0; 
if (fclose(fp) = 


ll = 
四 
O 
本 


return(-1); 


while (waitpid(pid, &stat, 0) < 0) 


if (errno != EINTR) 
return(-1); /* error other than EINTR from waitpid() */ 
return(stat); /* return child's termination status */ 


图 15-12 popenER ZI Flpclose ži 


虽然 popen 的 核心 部 分 与 本 章 中 前 面 用 过 的 代码 类 似 ， 但 是 增加 
了 很 多 需要 考虑 的 细节 。 首 先 ， 每 次 调用 popen 时 ， 应 当 记 住所 创建 的 


子 进 程 的 进程 ID ， 以 及 其 文件 摘 述 符 或 FILE 指 针 。 我 们 选择 在 数组 
childpid 中 保存 子 进程 ID ， 并 用 文件 朱 述 符 作 为 其 下 标 。 于 是 ， 当 以 
FILE 指 针 作 为 参数 调用 pclose 时 ， 调 用 标准 WO 函数 和 们 eno 得 到 文件 描 壕 
符 ， 然 后 取得 子 进程 ID ， 并 用 其 作为 参数 调用 waitpid。 因 为 一 个 进程 
可 能 调用 popen 多 次 ， 所 以 在 动态 分 配 childpid 数 组 时 (第 一 次 调用 
popen 时 ) ， 其 数组 长 度 应 当 是 最 大 文件 描述 符 数 ， 于 是 该 数组 中 可 以 
存放 与 最 大 文件 描述 符 数 相同 的 子 进程 ID 数 。 

注意 ， 图 2-17 中 的 open_max 函 数 可 以 返回 打开 文件 的 最 大 个 数 的 
近似 值 ， 如 果 这 个 值 与 系统 不 相关 的 话 。 注 意 不 要 使 用 那 种 其 值 大 于 

(或 等 于 ) open_max 函 数 返 回 值 的 管道 文件 描述 符 。 对 于 popen， 如 果 
open max 函数 返回 的 值 恰巧 非常 小 ， 那 我 们 会 关闭 管道 文件 描述 符 并 
将 ermo 设 置 为 EMFILE， 以 此 表明 这 里 的 很 多 文件 描述 符 是 打开 的 ， 
最 后 返回 -1。 对 于 pclose， 如 果 对 应 于 文件 指针 参数 的 描述 行 比 所 期 望 
的 大 ， 则 将 errno 设 置 为 EINVAL， 并 返回 -1。 

调用 pipe 和 fork， 然 后 为 popen 范 数 中 的 每 个 进程 复制 合适 的 描述 
符 ， 这 个 过 程 和 我 们 在 本 章 前 面 所 做 的 相 类 似 。 

POSIX.1 要 求 popen 天 闭 那 些 以 前 调用 popen 打 开 的 、 现 在 仍然 在 子 
进程 中 打开 着 的 IO 流 。 为 此 ， 在 子 进程 中 从 头 逐 个 检查 childpid 数 组 的 
各 个 元 素 ， 关 闭 仍旧 打开 着 的 描述 符 。 

若 pclose 的 调用 者 已 经 为 信号 SIGCHLD 设 置 了 一 个 信号 处 理 程 
序 ， 则 pclose 中 的 waitpid 调 用 将 返回 一 个 错误 EINTR“。 因 为 允许 调用 者 
捕捉 此 信号 〈 或 者 任何 其 他 可 能 中 断 waitpid 调 用 的 信号 ) ， 所 以 当 
waitpid 被 一 个 捕捉 到 的 信号 中 断 时 ， 我 们 只 是 再 次 调用 waitpid ° 

注意 ， 如 果 应 用 程序 调用 waitpid， 并 且 获 得 了 popen 创 建 的 子 进程 
的 退出 状态 ， 那 么 我 们 会 在 应 用 程序 调用 pclose 时 调用 waitpid， 如 果 发 
现 子 进程 已 不 再 存在 ， 将 返回 -1， 将 errno 设 置 为 ECHILD。 这 正 是 这 种 
情况 下 POSIX.1 所 要 求 的 。 


如 果 一 个 信号 中 断 了 wait，pclose 的 一 些 早期 版 本 会 返回 错误 
EINTR 。pclose 的 一 些 早期 版 本 在 wait 期 间 ， 会 阻塞 或 忽略 信号 
SIGINT、SIGQUIT 和 SIGHUP。 这 是 POSIX.1 所 不 允许 的 。 

注意 ，popen 决 不 应 由 设置 用 户 ID 或 设置 组 ID 程序 调用 。 当 它 执行 
命令 时 ，popen 等 同 于 : 

execl("/bin/sh", "sh", "-c", command, NULL); 

它 在 从 调用 者 继承 的 环境 中 执行 shell Jf EH shell f£ E PUT 
command。 一 个 恶意 用 户 可 以 操控 这 种 环境 ， 使 得 shell 能 以 设置 人 D 文 
件 模式 所 授予 的 提升 了 的 权限 以 及 非 预 期 的 方式 执行 命令 。 

popen 特 别 适 用 于 执行 简单 的 过 滤器 程序 ， 它 变换 运行 命令 的 输入 
或 输出 。 当 命令 希望 构造 它 目 己 的 管道 时 ， 融 是 这 种 情形 。 

实例 

考虑 一 个 应 用 程序 ， 它 向 标准 输出 写 一 个 提示 ， 然 后 从 标准 输入 
读 1 行 。 使 用 popen， 可 以 在 应 用 程序 和 输入 之 间 插 入 一 个 程序 以 便 对 
输入 进行 变换 处 理 。 图 15-13 显 示 了 这 种 情况 下 的 进程 安排 。 


父 进 程 过 滤器 程序 


pat 


stdout 


图 15-13 用 popen 对 输入 进行 变换 处 理 
对 输入 进行 的 变换 可 能 是 路 径 名 扩充 ， 或 者 是 提供 一 种 历史 机 制 
( 记 住 以 前 输入 的 命令 ) 。 


图 15-14 是 一 个 简单 的 用 于 演示 这 个 操作 的 过 滤 程 序 。 它 将 标准 输 


入 复制 到 标准 输出 ， 在 复制 时 将 大 写字 符 变 换 为 小 写字 符 。 在 写 完 换 
行 符 之 后 ， 


要 仔细 冲洗 (用 fflush) 标准 输出 ， 这 样 做 的 理由 将 在 下 一 


协同 进程 时 讨论 。 


#include "apue.h" 


#include <ctype.h> 


int 


main (void) 


{ 


int C}; 


while ((c = getchar()) != EOF) { 
if (isupper(c)) 
c = tolower (c); 
if (putchar(c) == EOF) 
err sys("output error"); 
if (c == '\n') 
fflush(stdout); 


exit(0); 


图 15-14 将 大 写字 符 变换 成 小 写字 符 的 过 滤 程 序 


将 这 个 过 滤 程 序 编译 成 可 执行 文件 myuclc， 然 后 图 15-15 的 程序 会 


用 popen 调 用 它 ° 


#include "apue.h" 
#include «sys/wait.h» 


int 


main (void) 


{ 


char line [MAXLINE]; 
FILE *fpin; 
if ((fpin = popen("myuclc", "r")) == NULL) 
err_sys("popen error"); 
for (; 7) { 
fputs ("prompt» ", stdout); 
fflush (stdout) ; 
if (fgets(line, MAXLINE, fpin) == NULL) /* read from pipe */ 
break; 
if (fputs(line, stdout) == EOF) 


err_sys("fputs error to pipe"); 
} 
if (pclose(fpin) == -1) 
err_sys("pclose error"); 
putchar('\n'); 
exit (0); 


图 15-15 调用 大 写 /小 写 过 滤 程 序 读 取 命令 
因为 标准 输出 通常 是 行 缓冲 的 ， 而 提示 并 不 包 合 换行 件 ， 所 以 在 
瑟 了 提示 之 后 ， 需 要 调用 fflush 。 


UNIX 系 统 过 滤 程 序 从 标准 输入 读 取 数据 ， 向 标准 输出 写 数据 。 几 

个 过 滤 程 序 通 常 在 shell 管 道中 线性 连接 。 当 一 个 过 滤 程 序 既 产生 某 个 

过 滤 程 序 的 输入 ， 又 读 取 该 过 滤 程 序 的 输出 时 ， 它 就 变 成 了 协同 进程 
(coprocess) ° 

Korn shell 提 供 了 协同 进程 [Bolsky and Korn 1995] ° Bourne shell ^ 

Bourne-again shell #1C shell 并 没有 提供 将 进程 连接 成 协同 进程 的 方法 。 

协同 进程 通常 在 shell 的 后 台 运 行 ， 其 标准 输入 和 标准 输出 通过 管道 连 


接 到 男 一 个 程序 。 虽 然 初始 化 一 个 协同 进程 ， 并 将 其 输入 和 输出 连接 
到 男 一 个 进程 的 shell 语 法 是 十 分 奇特 的 (详细 情况 见 Bolsky 和 
Korn[1995] FAY #62~63 01) ， 但 是 协同 进程 的 工作 方式 在 C 程 序 中 也 
EJEA HHY ° 
popen KERERE PERE PT A EE C A ER [6] 

EE, WEEE A XEBESI PE EY SS: 一 个 接 到 
其 标准 输入 ， 男 一 个 则 来 目 其 标准 输出 。 我 们 想 将 数据 写 到 其 标准 输 
， 经 其 处 理 后 ， 再 从 其 标准 输出 读 取 数 据 。 

实例 

让 我 们 通过 一 个 实例 来 观察 协同 进程 。 进 程 创 建 两 个 管道 ,一 个 
苹 协 同 进程 的 标准 输入 ， 男 一 个 十 协同 进程 的 标准 输出 。 图 15-16 显 示 
了 这 种 安排 。 


父 进 程 子 进程 ( 协同 进程 ) 
fd1[1] stdin 


» 


fd2[0] SÉ stdout 
图 15-16 通过 写 协同 进程 的 标准 输入 和 读 取 它 的 标准 输出 来 驱动 协同 进程 
图 15-17 中 的 程序 是 一 个 简单 的 协同 进程 ， 它 从 其 标准 输入 读 取 两 
个 数 ， 计 算 它 们 的 和 ， 然 后 将 和 写 至 其 标准 输出 。 (协同 进程 通常 会 
做 较 此 更 有 意义 的 工作 。 设 计 本 实例 的 目的 是 帮助 了 解 将 进程 连接 起 
来 所 需 的 各 种 管道 设施 。) 


#include "apue.h" 


int 

main (void) 

{ 
int n, Ist, intzs 
char line[MAXLINE]; 


while ((n = read(STDIN FILENO, line, MAXLINE)) > 0) { 


line[n] = 0; /* null terminate */ 
if (sscanf(line, "$d$d", &intl, &int2) == 2) ( 
sprintf(line, "Sd\n", intl + int2); 
n = strlen (line); 
if (write(STDOUT FILENO, line, n) !- n) 
err sys("write error"); 
LP <evse: T 
if (write(STDOUT FILENO, "invalid args\n", 13) != 13) 


err sys("write error"); 


exit(0); 


图 15-17 将 两 个 数 相 加 的 简单 过 滤 程 序 

对 此 程序 进行 编译 ， 将 其 可 执行 目标 代码 存 入 名 为 add2 的 文件 。 

图 15-18 中 的 程序 从 其 标准 输入 读 取 两 个 数 之 后 调用 add2 协 同 进 
程 ， 并 将 协同 进程 送 来 的 值 写 到 其 标准 输出 。 


#include "apue.h" 
static void sig pipe(int); /* our signal handler */ 
int 


main (void) 


( 


int n; fal (2), £d2[2]; 

pid t pid; 

char line[MAXLINE]; 

if (signal(SIGPIPE, sig pipe) == SIG ERR) 


err sys("signal error"); 


if (pipe(fd1) « 0 || pipe(fd2) « 0) 
err sys("pipe error"); 


if ((pid = fork()) « 0) { 
err sys("fork error"); 

) else if (pid » 0) ( /* parent */ 
close(fd1[0]); 
close(fd2[1]); 


while (fgets(line, MAXLINE, stdin) != NULL) { 
n = strlen(line); 
if (write(fdl[1], line, n) != n) 


err sys("write error to pipe"); 

if ((n = read(fd2[0], line, MAXLINE)) « 0) 
err sys("read error from pipe"); 

if (n == 0) { 
err msg("child closed pipe"); 


break; 
) 
line[n] = 0; /* null terminate */ 
if (fputs(line, stdout) == EOF) 


err_sys("fputs error"); 


if (ferror (stdin) ) 
err_sys("fgets error on stdin"); 
exit (0); 

} else { /* child */ 
close(fd1[1]); 
close (fd2[0]); 
if (fd1[0] != STDIN FILENO) { 

if (dup2 (fdl[0], STDIN FILENO) != STDIN FILENO) 
err sys("dup2 error to stdin"); 
close (fd1[0]); 


if (fd2[1] != STDOUT FILENO) { 
if (dup2(fd2[1], STDOUT FILENO) != STDOUT FILENO) 
err sys("dup2 error to stdout"); 
close(fd2[1]); 


if (execl("./add2", "add2", (char *)0) < 0) 
err sys("execl error"); 
) 
exit (0); 
) 


static void 

Sig pipe(int signo) 

{ 
printf ("SIGPIPE caught\n"); 
exit(1); 

} 


图 15-18 驱动 add2 过 滤 程 序 的 程序 

这 个 程序 创建 了 两 个 管道 ， 父 进程 、 子 进程 各 自 关 闭 它们 不 需 使 
用 的 管道 端 。 必 须 使 用 两 个 管道 : 一 个 用 作协 同 进 程 的 标准 输入 ， 另 
一 个 则 用 作 它 的 标准 输出 。 然 后 ， 子 进程 调用 dup2 使 管道 描述 符 移 至 
其 标准 输入 和 标准 输出 ， 最 后 调用 了 execl。 

若 编译 和 运行 图 15-18 中 的 程序 ， 它 会 按 预 期 工作 。 此 外 ， 着 图 15- 
18 中 的 程序 在 等 待 输入 的 时 候 杀 死 了 add2 协 同 进 程 ， 然 后 又 输入 两 个 
数 ， 那 么 程序 对 没有 读 进 程 的 管道 进行 写 操作 时 ， 会 调用 信号 处 理 程 
FF (见习 题 15.4) 

实例 

在 协同 进程 add2 〈 见 图 15-17) 中 ， 我 们 故意 使 用 了 底层 IO 

(UNIX 系 统 调用 ) : read 和 write。 如 果 使 用 标准 MO 来 改写 该 协同 进 

程 ， 会 怎么 样 呢 ? 图 15-19 所 示 的 程序 就 是 改写 后 的 版 本 。 


#include "apue.h" 

int 

main (void) 

{ 
int intl, int2; 
char line [MAXLINE] ; 


while (fgets(line, MAXLINE, stdin) != NULL) { 
if (sscanf(line, "$d$d", &intl, &int2) == 2) { 
if (printf("$dWMn", intl + int2) == EOF) 
err_sys("printf error"); 
} else { 
if (printf("invalid args\n") == EOF) 
err_sys("printf error"); 
} 
} 
exit (0); 


图 15-19 将 两 个 数 相 加 的 过 滤 程 序 ， 使 用 标准 IO 
大 图 15-18 中 的 程序 调用 这 个 新 的 协同 进程 ， 则 它 不 再 工作 。 问 题 
出 在 黑 认 的 标准 MO 缓冲 机 制 上 。 当 调用 图 15-19 中 的 程序 时 ， 对 标准 输 
入 的 第 一 个 fgets 引 起 标准 WO 库 分 配 一 个 缓冲 区 ， 并 选择 缓冲 的 类 型 。 
因为 标准 输入 是 一 个 管道 ， 所 以 标准 MO 库 默 认 是 全 缓冲 的 。 标 准 输出 
也 是 如 此 。 当 add2 从 其 标准 输入 读 取 而 发 生 阻 塞 时 ， 图 15-18 中 的 程序 
从 管道 读 时 也 发 生 阻 塞 ， 于 是 产生 了 和 死 锁 。 
这 里 ， 可 以 对 将 要 运行 的 这 一 协同 进程 加 以 控制 。 我 们 可 以 修改 
图 15-19 中 的 程序 ， 在 while 循 环 之 前 加 上 下 面 4 行 : 
if (setvbuf(stdin, NULL, _IOLBF, 0) != 0) 
err sys("setvbuf error"); 
if (setvbuf(stdout, NULL, _IOLBF, 0)!= 0) 
err_sys("setvbuf error"); 
这 些 代码 行使 得 : 当 有 一 行 可 用 时 ，fgets 就 返回 ， 当 输出 一 个 换 
行 符 时 ，Pprintf 立即 执行 了 ush 操 作 。 对 setvbuf 进 行 的 这 些 显 式 调用 使 得 
图 15-19 中 的 程序 能 正常 工作 了 。 


如 果 不 能 修改 管道 输出 的 目标 程序 ， 则 需 使 用 其 他 技术 。 例 如 ， 
如 果 在 程序 中 使 用 awk(1) 作 为 协同 进程 《代替 add2 程 序 ) ， 则 下 列 命 
令 行 不 能 工作 : 

#! /bin/awk/ -f 

{ print $1 + $2 } 

不 能 工作 的 原因 还 古 标准 WO 的 缓冲 机 制 问 题 。 但 是 在 这 种 情况 

下 ， 无 法 改变 awk 的 工作 方式 (除非 有 awk 的 源 代码 ) 。 我 们 不 能 修改 
awk 的 可 执行 代码 ， 于 是 也 区 不 能 更 改 处 理 其 标准 IO 缓冲 的 方式 。 

对 这 种 问题 的 一 般 解决 方法 是 使 被 调用 (在 本 例 中 是 awk) 的 协同 
进程 认为 它 的 标准 输入 和 输出 都 被 连接 到 了 一 个 终端 。 这 使 得 协同 进 
程 中 的 标准 VO 例 程 对 这 两 个 VO 流 进行 行 缓冲 ， 这 类 似 于 前 面 所 做 的 显 
式 调用 setvbuf。 第 19 章 将 用 伪 终 端 实现 这 种 方法 。 


15.5 FIFO 


FIFO 有 时 被 称 为 命名 管道 。 未 命名 的 管道 只 能 在 两 个 相关 的 进程 
之 间 使 用 ， 而 且 这 两 个 相关 的 进程 还 要 有 一 个 共同 的 创建 了 它们 的 祖 
先进 程 。 但 是 ， 通 过 FIFO， 不 相关 的 进程 也 能 交换 数据 。 

第 14 章 中 已 经 提 及 FIFO 是 一 种 文件 类 型 。 通 过 stat 结 构 ( 见 4.2 市 ) 
的 st_mode 成 员 的 编码 可 以 知道 文件 是 否 是 FIFO 类 型 。 可 以 用 S_ISFIFO 
宏 对 此 进行 测试 。 

创建 FIFO 类 似 于 创建 文件 。 确 实 ，FIFO 的 路 径 名 存在 于 文件 系统 
中 o 


#include <sys/stat.h> 


int mkfifo(const char *path, mode_t mode); 


int mkfifoat(int fd, const char *path, mode_t mode); 


两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0;， 若 出 错 ， 返 回 -1 
mkfifo K Zt F mode ZZ E] ALAR Ut A 5j open ER Zt FH mode) TH IR]. (JL 
3.835) 。 新 FIFO 的 用 户 和 组 的 所 有 权 规 则 与 4.6 节 所 述 的 相同 。 
mkfifoat 函 数 和 mkfifo 函 数 相似 ， 但 是 mkfifoat 函 数 可 以 被 用 来 在 fd 
文件 描述 符 表 示 的 目录 相关 的 位 置 创建 一 个 FIFO。 像 其 他 *at 范 数 一 
样 ， 这 里 有 3 种 情形 : 
(1) 如 果 path 参 数 指定 的 是 绝对 路 径 名 ， 则 fd 参数 会 被 忽略 掉 ， 
并 且 mkfifoat 函 数 的 行为 和 mkfifo 类 似 。 
(2) 如 果 path 参 数 指定 的 是 相对 路 径 名 ， 则 fd 参数 是 一 个 打开 目 
录 的 有 效 文件 描述 符 ， 路 径 名 和 目录 有 关 。 
(3) 如 果 path 参 数 指定 的 是 相对 路 径 名 ， 并 有 旦 fd 参数 有 一 个 特殊 
值 AT_FDCWD， 则 路 径 名 以 当前 目录 开始 ，mkfifoat 和 mkfifo 类 似 。 

当 我 们 用 mkfifo 或 者 mkfifoat 创 建 FIFO 时 ， 要 用 open 来 打开 它 。 确 
SE. IE?É HJOCTELOENZX (如 dose、read、write 和 unlink) 都 需要 
FIFO 。 

应 用 程序 可 以 用 mknod 和 mknodat 函 数 创 建 FHIFO。 因 为 POSIX.1 原 
7: Jt 1X8 &15mknodÉNZX, Ar LA mkfifozé £I |X POSIX.1ix iT BJ © 
mknod 和 mknodat 函 数 现 在 已 包括 在 POSIX.1 的 XSI 扩 展 中 。 

POSIX.1 也 包括 了 对 mkfifo(1) 命 令 的 支持 。 本 书 讨论 的 4 种 平台 都 
提供 此 命令 。 因 此 ， 可 以 用 一 条 shell 命 令 创 建 一 个 FIFO， 然 后 用 一 般 
的 shell WO 重 定 癌 对 其 进行 访问 。 

当 open 一 个 FIFO 时 ， 非 阻塞 标志 (O NONBLOCK) 会 产生 下 列 
影响 。 

"在 一 般 情况 下 (没有 指定 O_NONBLOCK) ， 只 读 open 要 阻塞 到 
某 个 其 他 进程 为 写 而 打开 这 个 FIFO 为 止 。 类 似 地 ， 只 写 open 要 阻塞 到 
某 个 其 他 进程 为 读 而 打开 它 为 止 。 


如果 指定 了 O NONBLOCK, Jill Hix open 立即 返回 。 但 是 ， 如 果 
没有 进程 为 读 而 打开 一 个 FIFO， 那 么 只 写 open 将 返回 -1， 并 将 errno 设 
置 成 ENXIO ° 

RW SE, Æ write 一 个 疝 无 进程 为 读 而 打开 的 FIFO， 则 产生 
ay SIGPIPE。 奉 某 个 FIFO 的 最 后 一 个 写 进 程 关 财 了 该 FIFO， 则 将 为 
该 FIFO 的 读 进程 产生 一 个 文件 结束 标志 “。 

一 个 给 定 的 FIFO 有 多 个 写 进程 是 常见 的 。 这 就 意味 着 ， 如 采 不 项 
望 多 个 进程 所 写 的 数据 交叉 ， 则 必须 考虑 原子 写 操作 。 和 管道 一 样 ， 
常量 PIPE_BUF 说 明了 可 被 原子 地 写 到 FIFO 的 最 大 数据 量 。 

FIFO 有 以 下 两 种 用 途 。 

(1) shell 命 令 使 用 FIFO 将 数据 从 一 条 管道 传送 到 另 一 条 时 ， 无 需 
创建 中 间 临 时 文件 。 

(2) 客户 进程 -服务 器 进程 应 用 程序 中 ，FIFO RCRA, E% 
户 进 程 和 服务 器 进程 二 者 之 间 传 递 数据 。 

我 们 各 用 一 个 实例 来 说 明 这 两 种 用 途 。 

实例 : 用 FIFO 复 制 输出 流 

FIFO 可 用 于 复制 一 系列 sell 命 令 中 的 输出 流 。 这 就 防止 了 将 数据 写 
向 中 间 磁 盘 文 件 (类 似 于 使 用 管道 来 避免 中 间 人 磁盘 文件 ) 。 但 是 不 同 
的 是 ， 管 道 只 能 用 于 两 个 进程 之 间 的 线性 连接 ， 而 FIFO 是 有 和 名字 的 ， 
因此 它 可 用 于 非 线性 连接 。 

考虑 这 样 一 个 过 程 ， 它 需要 对 一 个 经 过 过 滤 的 输入 流 进行 两 次 处 
理 。 图 15-20 显 示 了 这 种 安排 。 


输入 
xt 


图 15-20 对 一 个 经 过 过 滤 的 输入 流 进行 两 次 处 理 的 过 程 

使 用 FIFO 和 UNIX 程 序 tee(1) 束 可 以 实现 这 样 的 过 程 而 无 需 使 用 临 
时 文件 。 (tee 程序 将 其 标准 输入 同时 复制 到 其 标准 输出 以 及 其 命令 行 
中 命名 的 文件 中 。) 

mkfifo fifo1 

prog3 < fifol & 


prog1 < infile | tee fifo1 | prog2 
创建 FIFO ， 然 后 在 后 台 启 动 prog3， 从 FIFO 读 数据 。 然 后 启动 
progl， 用 tee 将 其 输出 发 送 到 FIFO 和 prog2。 图 15-21 显 示 了 进程 安排 。 


输入 
文件 


图 15-21 使 用 FIFO 和 tee 将 一 个 流 发 送 到 两 个 不 同 的 进程 
实例 : 使 用 FIFO 进 行 客户 进程 -服务 器 进程 通信 
FIFO 的 为 一 个 用 途 古 在 客户 进程 和 服务 紫 进 程 之 间 传 送 数 据 。 如 

果 有 一 个 服务 器 进程 ， 它 与 很 多 客户 进程 有 和 天 ， 每 个 客 刻 进程 都 可 将 


其 请 求 写 到 一 个 该 服务 器 进程 创建 的 众所周知 的 FIFO 中 (“众所周知 ” 
的 意思 是 : 所 有 需 与 服务 器 进程 联系 的 客户 进程 都 知道 该 FIFO 的 路 径 
名 ) 。 图 15-22 显 示 了 这 种 安排 。 


图 15-22 客户 进程 用 FIFO 向 服务 器 进程 发 送 请 求 

因为 该 FIFO 有 多 个 写 进程 ， 所 以 客户 进程 发 送 给 服务 璐 进程 的 请 
求 的 长 度 要 小 于 PIPE_BUF 字 廊 。 这 样 就 能 避免 客户 进程 的 多 次 写 之 间 
的 交叉 。 

在 这 种 类 型 的 客户 进程 -服务 器 进程 通信 中 使 用 FIFO 的 问题 是 : 服 
务 古 进程 如 何 将 回答 送 回 各 个 客户 进程 。 不 能 使 用 单个 FIFO， 因 为 客 
户 进程 不 可 能 知道 何 时 去 读 它们 的 响应 以 及 何 时 响应 其 他 客户 进程 。 
一 种 解决 方法 是 ， 每 个 客户 进程 都 在 其 请 求 中 包含 它 的 进程 ID。 然 后 


服务 器 进程 为 每 个 客户 进程 创建 一 个 FIFO， 所 使 用 的 路 径 名 是 以 客户 
进程 的 进程 ID 为 基础 的 。 人 例如， 服务 器 进程 可 以 用 名 
字 /tmp/serv1.XXXXX 创 建 FHIFO， 其 中 XXXXX 被 奉 换 成 客户 进程 的 进 
程 ID。 图 15-23 显 示 了 这 种 安排 。 


服务 器 进程 


众所周知 的 
FIFO 


客户 进程 专用 
FIFO 


图 15-23 用 FIFO 进 行 客户 进程 -服务 器 进程 通信 

虽然 这 种 安排 可 以 工作 ， 但 服务 器 进程 不 能 判断 一 个 客户 进程 是 
否 和 朋 溃 终止 ， 这 就 使 得 客户 进程 专用 FIFO 会 遗留 在 文件 系统 中 。 另 
外 ， 服 务 器 进程 还 必须 得 捕捉 SIGPIPE 信 号 ， 因 为 客户 进程 在 发 送 一 个 
请 求 后 有 可 能 没有 读 取 响应 就 终止 了 ， 于 是 留 下 一 个 只 有 写 进 程 ( 服 
务 器 进程 ) 而 无 读 进程 的 客户 进程 专用 FIFO 。 

按照 图 15-23 中 的 安排 ， 如 果 服 务 器 进程 以 只 读 方式 打开 众所周知 
的 FIFO (因为 它 只 需 读 该 FIFO) ， 则 每 当 客 户 进 程 个 数 从 1 变 成 0 时 ， 
服务 器 进程 就 将 在 FIFO 中 读 到 (read) 一 个 文件 结束 标志 。 为 使 服务 


ant he oe PAD E, —RUÉERSIaNTIBEEBSR 38Xtfx DAE 7; 
式 打 开 该 众所周知 的 FIFO (见习 题 15.10) ° 


15.6 XSI IPC 

有 3 种 称 作 XSI IPCHJIPC: 消息 队列 、 信 号 量 以 及 共享 存储 器 。 它 
们 之 间 有 很 多 相似 之 处 。 本 节 先 介绍 它们 相 类 似 的 特征 ， 后 面 几 节 将 
说 明 这 些 IPC 各 上 自 的 特殊 功能 。 

XSI IPC 函 数 是 紧密 地 基于 System V 的 IPC 函 数 的 。 这 3 种 类 型 的 
XSIIPC 源 自 于 1970 年 的 一 种 称 为 “Columbus UNIX” 的 AT&T 内 部 版 本 。 
后 来 它们 被 添加 到 System VY 上 。 由 于 XSI IPC 不 使 用 文件 系统 命名 空 
间 ， 而 是 构造 了 它们 自己 的 命名 空间 ， 为 此 常常 受到 批评 。 


15.6.1 标识 符 和 键 


每 个 内 核 中 的 IPC 结构 〈 消 息 队 列 、 信 和 号 量 或 共享 存储 段 ) 都 用 
一 个 非 负 整数 的 标识 符 (identifier) 加 以 引用 。 例 如 ， 要 向 一 个 消息 队 
列 发 送 消 息 或 者 从 一 个 消息 队列 取消 息 ， 只 需要 知道 其 队列 标识 符 。 
与 文件 描述 符 不 同 ，IPC 标 识 符 不 是 小 的 整数 。 当 一 个 IPC 结 构 被 创 
建 ， 然 后 义 被 删除 时 ， 与 这 种 结构 相关 的 标识 符 连续 加 1， 直 至 达到 一 
个 整 型 数 的 最 大 正 值 ， 然 后 义 回 转 到 0 © 

标识 符 是 IPC 对 象 的 内 部 名 。 为 使 多 个 合作 进程 能 够 在 同一 IPC 对 
象 上 汇聚 ， 需 要 提供 一 个 外 部 命名 方案 。 为 此 ， 每 个 IPC 对 象 都 与 一 个 
BE (key) 相关 联 ， 将 这 个 键 作为 该 对 象 的 外 部 名 。 

无 论 何 时 创建 I[PC 结 构 (通过 调用 msgget、semget 或 shmget 创 
££) ， 都 应 指定 一 个 键 。 这 个 键 的 数据 类 型 是 基本 系统 数据 类 型 


key t， 通 常 在 头 文 件 <sys/types.h> 中 被 定义 为 长 整 型 。 这 个 键 由 内 核 变 
换 成 标识 符 。 

有 多 种 方法 使 客户 进程 和 服务 器 进程 在 同一 IPC 结 构 上 汇聚 。 

(1) 服务 器 进程 可 以 指定 键 IPC_PRIVATE 创 建 一 个 新 IPC 结 构 ， 
将 返回 的 标识 符 存放 在 某 处 (如 一 个 文件 ) 以 便 客户 进程 取 用 。 键 
IPC_PRIVATE 保 证 服务 器 进程 创建 一 个 新 IPC 结 构 。 这 种 技术 的 缺点 
是 : 文件 系统 操作 需要 服务 器 进程 将 整 型 标识 符 写 到 文件 中 ， 此 后 客 
户 进程 又 要 读 这 个 文件 取得 此 标识 符 。 

IPC PRIVATE 键 也 可 用 于 父 进 程 子 关系 。 父 进程 指定 
IPC_PRIVATE 创 建 一 个 新 IPC 结 构 ， 所 返回 的 标识 符 可 供 fork 后 的 子 进 
程 使 用 。 接 着 ， 子 进程 又 可 将 此 标识 符 作 为 exec 函 数 的 一 个 参数 传 给 一 
个 新 程序 。 

(2) 可 以 在 一 个 公用 头 文件 中 定义 一 个 客户 进程 和 服务 器 进程 都 
认可 的 键 。 然 后 服务 器 进程 指定 此 键 创建 一 个 新 的 IPC 结 构 。 这 种 方法 
的 问题 是 该 键 可 能 已 与 一 个 IPC 结 构 相 结合 ， 在 此 情况 下 ，get 画 数 

(msgget、semget 或 shhmget) 出 错 返 回 。 服 务 器 进程 必须 处 理 这 一 错 
误 ， 删 除 已 存在 的 IPC 结 构 ， 然 后 试 着 再 创建 它 。 

(3) 客户 进程 和 服务 器 进程 认同 一 个 路 径 名 和 项 目 ID (AIDE 
0 一 255 之 间 的 字符 值 ) ， 接 着 ， 调 用 函数 ftok 将 这 两 个 值 变 换 为 一 个 
键 。 然 后 在 方法 (2) 中 使 用 此 键 。ftok 提 供 的 唯一 服务 就 是 由 一 个 路 
径 名 和 项 目 ID 产生 一 个 键 。 


#include <sys/ipc.h> 


key_t ftok(const char *path, int id); 
REME: ARJ, RISE, 者 出 错 ， 返 回 (key_bD-1 
path 参 数 必须 引用 一 个 现 有 的 文件 。 当 产生 键 时 ， 只 使 用 id 参数 的 
低 8 位 。 


ftok 创 建 的 键 通常 是 用 下 列 方式 构成 的 : 按 给 定 的 路 径 名 取得 其 
stat (14.27) 中 的 部 分 st_dev 和 st_ino 字 段 ， 然 后 再 将 它们 与 项 目 
ID 组 合 起 来 。 如 果 两 个 路 径 名 引用 的 是 两 个 不 同 的 文件 ， 那 么 ftok 通 常 
会 为 这 两 个 路 径 名 返回 不 同 的 键 。 但 是 ， 因 为 iP 点 编号 和 键 通常 都 存 
放 在 长 整 型 中 ， 所 以 创建 键 时 可 能 会 丢失 信息 。 这 意味 着 ， 对 于 不 同 
文件 的 两 个 路 径 名 ， 如 果 使 用 同一 项 目 ID， 那 么 可 能 产生 相同 的 键 。 

3 个 get 函 数 (msgget、semget 和 shmget) 都 有 两 个 类 似 的 参数 : 一 

个 key 和 一 个 整 型 flag。 在 创建 新 的 IPC 结 构 (通常 由 服务 器 进程 创建 ) 
H 上 时 ， 如 果 key 是 IPC_PRIVATE 或 者 和 当前 某 种 类 型 的 IPC 结 构 无 天 ， 则 
需要 指明 flag 的 IPC_CREAT 标 志 位 。 为 了 引用 一 个 现 有 队列 (通常 由 客 
户 进程 创建 ) ，key 必 须 等 于 队列 创建 时 指明 的 key 的 值 ， 并 且 
IPC_CREAT 必 须 不 被 指明 。 

注意 ， 决 不 能 指定 IPC. PRIVATE 作为 键 来 引用 一 个 现 有 队列 ， 
为 这 个 特殊 的 键 值 总 是 用 于 创建 一 个 新 队列 。 为 了 引用 一 个 用 
IPC PRIVATE 键 创建 的 现 有 队列 ， 一 定 要 知道 这 个 相关 的 标识 符 ， 然 
后 在 其 他 IPC 调用 中 (如 msgsnd ^ msgrev). 使 用 该 标识 符 ， 这 样 可 以 
FT get KRT 。 

如 有 果 和 希望 创建 一 个 新 的 了 PC 结构 ， 而 且 要 确保 没有 引用 具有 同一 标 
识 符 的 一 个 现 有 IPC 结 构 ， 那 么 必须 在 flag 中 同时 指定 IPC_CREAT 和 
IPC_EXCL 位 。 这 样 做 了 以 后 ， 如 有 果 IPC 结 构 已 经 存在 就 会 造成 出 错 ， 
返回 EEXIST (这 与 指定 了 O_CREAT 和 O_EXCL 标 志 的 open 相 类 似 ) 。 


15.6.2 结 松 


XSIIPC 为 每 一 个 了 PC 结构 关联 了 一 个 ipc_perm 结 构 。 该 结构 规定 了 
权限 和 所 有 者 ， 它 至 少 包 括 下 列 成 员 : 


struct ipc perm { 


uid t uid; /* owner's effective user id */ 
gid t gid; /* owner's effective group id */ 
uid t cuid; /* creator's effective user id */ 
gid t cgid; /* creator's effective group id */ 


mode t mode; /* access modes */ 


一 一 
is 


每 个 实现 会 包括 男 外 一 些 成 员 。 如 欲 了 解 你 所 用 系统 中 人 它 的 完整 
定义 ， 请 参见 <sys/ipc.h>。 

在 创建 JPC 结 构 时 ， 对 所 有 字段 都 赋 初 值 。 以 后 ， 可 以 调用 
msgctl、semctl 或 shmctl 修 改 uid、gid 和 mode 字 上 段 。 为 了 修改 这 些 值 ， 调 
用 进程 必须 是 IPC 结 构 的 创建 者 或 超级 用 户 。 修 改 这 些 字 段 类 似 于 对 文 
件 调用 chown 和 chmod。 

mode 字 段 的 值 类 似 于 图 4-6 中 所 示 的 值 ， 但 是 对 于 任何 IPC 结 构 都 
不 存在 执行 权限 。 男 外 ， 消 息 队 列 和 共享 存储 使 用 术语 “ 读 ” 和 “ 写 ”， 而 
信号 量 则 用 术语 * 读 > 和“ 更改 ”(alter) 。 图 15-24 显 示 了 每 种 IPC 的 6 种 
权限 。 


用 户 读 
用 户 写 (更 改 ) 


组 读 

组 写 (更 改 ) 
其 他 读 

其 他 写 (更 改 ) 


图 15-24 XSI IPC 权 限 


某 些 实现 定义 了 表示 每 种 权限 的 符号 常量 ,但 是 这 些 常 量 并 不 包 
括 在 Single UNIX Specification 中 。 


15.6.3 结构 限制 


所 有 3 种 形式 的 XSI IPC 都 有 内 置 限制 。 大 多 数 限 制 可 以 通过 重新 
配置 内 核 来 改变 。 在 对 这 3 种 形式 的 IPC 中 的 每 一 种 进行 描述 时 ， 我 们 
都 会 指出 它 的 限制 。 

在 报告 和 修改 限制 方面 ， 每 种 平台 都 有 自己 的 方法 。FreeBSD 
8.0 ` Linux 3.2.0 和 Mac OS X 10.6.8 提 供 了 sysctl 命 令 来 观察 和 修改 内 核 
配置 参数 。 在 Solaris 10 中 ， 可 以 用 prctl 命 令 来 改变 内 核 IPC 的 限制 。 

在 Linux 中 ， 可 以 运行 ipcs -| 来 显示 IPC 相 关 的 限制 。 在 FreeBSD 
中 ， 等 效 的 命令 是 ipcs-T。 在 Solaris 中 ， 可 以 通过 运行 sysdef -y 来 找到 
HY Ya) TT SRY o 


15.6.4 优点 BÀ 


XSI IPC 的 一 个 基本 问题 是 : IPC 结构 是 在 系统 范围 内 起 作用 的 ， 
没有 引用 计数 。 例 如 ， 如 果 进 程 创建 了 一 个 消息 队列 ， 并 且 在 该 队列 
中 放 入 了 几 则 消息 ， 然 后 终止 ， 那 么 该 消息 队列 及 其 内 容 不 会 被 删 
除 。 它 们 会 一 直 留 在 系统 中 直至 发 生 下 列 动 作为 止 ， 由 某 个 进程 调用 
msgrcv 或 msgct 读 消息 或 删除 消息 队列 ;或 某 个 进程 执行 pcrm(TD 命 令 
删除 消息 队列 ; 或 正在 自 举 的 系统 删除 消息 队列 。 将 此 与 管道 相 比 ， 
当 最 后 一 个 引用 管道 的 进程 终止 时 ， 管 道 就 被 完全 地 删除 了 。 对 于 
FIFO 而 言 ， 在 最 后 一 个 引用 FIFO 的 进程 终止 时 ， 虽 然 FIFO 的 名 字 仍 保 
留 在 系统 中 ， 直 至 被 显 式 地 删除 ， 但 是 留 在 FIFO 中 的 数据 已 被 删除 
了 o 


XSI IPC 的 另 一 个 问题 是 ， 这 些 IPC 结 构 在 文件 系统 中 没有 名 字 。 
我 们 不 能 用 第 3 章 和 第 4 章 中 所 述 的 函数 来 访问 它们 或 修改 它们 的 属 
性 。 为 了 支持 这 些 IPC 对 象 ， 内 核 中 增加 了 十 几 个 全 新 的 系统 调用 

(msgget、semop、shmat 等 ) 。 我 们 不 能 用 ls 命令 查看 IPC 对 象 ， 不 能 
用 rm 命令 删除 它们 ， 也 不 能 用 chmod 命 令 修 改 它 们 的 访问 权限 。 于 是 ， 
又 增加 了 两 个 新 命令 ipcs(1) 和 ipcrm(1)。 

因为 这 些 形式 的 IPC 不 使 用 文件 摘 述 符 ， 所 以 不 能 对 它们 使 用 多 
路 转 接 IO 函数 (select 和 poll) 。 这 使 得 它 很 难 一 次 使 用 一 个 以 上 这 样 
的 IPC 结 构 ， 或 者 在 文件 或 设备 1/O 中 使 用 这 样 的 IPC 结 构 。 例 如 ， 如 果 
没有 某 种 形式 的 忙 等 循环 (busy-waitloop) ， 就 不 能 使 一 个 服务 器 进 
程 等 待 将 要 放 在 两 个 消息 队列 中 任意 一 个 中 的 消息 。 

Andrade、Carges 和 Kovach[1989] 对 使 用 System V IPC 构 建 的 一 个 事 
务 处 理 系统 进行 了 综述 。 他 们 认为 System V IPC 使 用 的 命名 空间 (标识 
符 ) 是 一 个 优点 ， 而 不 是 前 面 所 说 的 问题 ， 理 由 是 使 用 标识 符 使 一 个 
进程 只 要 使 用 单个 函数 调用 (msgsnd) 就 能 将 一 个 消息 发 送 到 一 个 队 
列 ， 而 其 他 形式 的 IPC 则 通常 还 要 调用 open、write 和 close。 这 种 说 法 是 
错误 的 。 为 了 避免 使 用 键 和 调用 msgget， 客 户 进程 总 要 以 某 种 方式 获 
得 服务 器 进程 队列 的 标识 符 。 分 派 给 特定 队列 的 标识 符 取 决 于 在 创建 
该 队列 时 ， 有 多 少 消 妃 队列 已 经 存在 ， 也 取决 于 目 内 核 目 举 以 来 ， 内 
核 中 将 分 配给 新 队列 的 表 项 已 经 使 用 了 多 少 次 。 这 是 一 个 动态 值 ， 无 
法 猜 到 或 事 移 存放 在 一 个 头 文 件 中 。 正 如 15.6.1 节 所 述 ， 至 少 服务 器 进 
程 应 将 分 配给 队列 的 标识 符 写 到 一 个 文件 中 以 便 客户 进程 读 取 。 

这 些 作者 列举 的 消 恩 队列 的 其 他 优点 是 : 它们 是 可 徘 的 、 流 控制 
的 以 及 面 铝 记录 的 ;它们 可 以 用 非 先 进 先 出 次 序 处 理 。 图 15-25 对 这 些 
不 同形 式 IPC 的 某 些 特征 进行 了 比较 。 


IPC 类 型 无 连接 ? | 可 靠 的 ? 


消息 队列 
STREAMS 


UNIX 域 流 套 接 字 
UNIX 域 数据 报 套 接 字 
FIFO (3E STREAMS) 


图 15-25 不 同形 式 IPC 之 间 的 特征 比较 
(我 们 将 在 第 16 章 中 描述 流 和 数据 报 套 接 字 ， 在 17.2 节 中 描述 
UNIX 域 套 接 字 。) 图 15-25 中 的 “无 连接 ” 指 的 是 无 需 先 调用 某 种 形式 
的 打开 函数 就 能 发 送 消 息 的 能 力 。 如 前 所 述 ， 因 为 需要 有 某 种 技术 来 
获得 队列 标识 符 ， 所 以 我 们 并 不 认为 消息 队列 是 无 连接 的 。 因 为 所 有 
这 些 形式 的 IPC 被 限 制 在 一 台 主 机 上 ， 所 以 它们 都 是 可 靠 的 。 当 消 忆 通 
过 网 络 传送 时 ， 就 要 考虑 丢失 消息 的 可 能 性 。*“ 流 控制 "的 意思 是 : 如 
果 系 统 资源 〈 缓 冲 区 ) 短缺 ， 或 者 如 果 接 收 进程 不 能 再 接收 更 多 消 
轧 ， 则 发 送 进程 束 要 休眠 。 当 流 控 制 条 件 消 失 时 ， 发 送 进 程 应 目 动 唤 
RE o 
图 15-25 中 没有 显示 的 一 个 特征 是 : IPC 设施 能 否 自 动 地 为 每 个 客 
户 进 程 创建 一 个 到 服务 器 进程 的 唯一 连接 。 第 17 章 将 说 明 UNIX 流 套 接 
字 可 以 提供 这 种 能 力 。 下 面 3 节 将 对 3 种 形式 的 XSI IPC 进 行 详细 的 描 
yli o 
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识 。 在 本 市 中 ， 我 们 把 消息 队列 简称 为 队列 ， 其 标识 符 简 称 为 队列 
ID ° 
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息 队列 接口 ， 该 接口 来 源 于 POSIX 实 时 扩展 。 本 书 不 讨论 这 个 接口 。 

msgget 用 于 创建 一 个 新 队列 或 打开 一 个 现 有 队列 。msgsnd 将 新 消 
息 添 加 到 队列 尾 端 。 每 个 消息 包含 一 个 正 的 长 整 型 类 型 的 字段 、 一 个 
非 负 的 长 度 以 及 实际 数据 字 节 数 〈 对 应 于 长 度 ) ， 所 有 这 些 都 在 将 消 
息 添 加 到 队列 时 ， 传 送 给 msgsnd。msgrcv 用 于 从 队列 中 取消 息 。 我 们 
并 不 一 定 要 以 先进 先 出 次 序 取消 息 ， 也 可 以 按 消息 的 类 型 字段 取消 
Ed o 
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每 个 队列 都 有 一 个 msqid_ds 结 构 与 其 相关 联 : 


struct msqid ds { 


struct ipc. perm msg perm; /* see Section 15.6.2 */ 

msgqnum t msg qnum; /* # of messages on 
queue */ 

msglen t msg qbytes; /* max # of bytes on 
queue */ 

pid t msg lspid; /* pid of last msgsnd() 
zi 

pid t msg lrpid; /* pid of last msgrcv() 
g 

time_t msg stime; /* last-msgsnd() time 
g 

time_t msg_rtime; /* last-msgrcv() time */ 

time_t msg_ctime; /* last-change time */ 


h 
此 结构 定义 了 队列 的 当前 状态 。 结 构 中 所 示 的 各 成 员 是 由 Single 
UNIX Specification 定 义 的 。 具 体 实现 可 能 包括 标准 中 没有 定义 的 男 一 
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图 15-26 列 出 了 影响 消 妃 队列 的 系统 限制 。“ 导 出 的 ?表示 这 种 限制 
来 源 于 其 他 限制 。 例 如 ， 在 Linux 系 统 中 ， 最 大 消息 数 是 根据 最 大 队列 
数 和 队列 中 所 允许 的 最 大 数据 量 来 决定 的 。 其 中 最 大 队列 数 还 要 根据 
系统 上 安装 的 RAM 的 数量 来 决定 。 注 意 ， 队 列 的 最 大 字 市 数 限制 进 一 
步 限 制 了 队列 中 将 要 存储 的 消息 的 最 大 长 度 。 

调用 的 第 一 个 函数 通常 是 msgget， 其 功能 是 打开 一 个 现 有 队列 或 
创建 一 个 新 队列 。 


说 明 
FreeBSD 8.0 Linux 3. 2. 0 Mac OS X 10. 6.8 Solaris 10 


-十 T 
可 发 送 的 最 长 消息 的 字 节 数 16 384 8 192 不 支持 


-个 特定 队列 的 最 大 字 节 数 ( 亦 即 队 2 048 16 384 不 支持 
列 中 所 有 消息 长 度 之 和 ) 
系统 中 最 大 消息 队列 数 40 16 不 支持 
系统 中 最 大 消息 数 40 导出 的 不 支持 


15-26 影响 消息 队列 的 系统 限制 


#include <sys/msg.h> 
int msgget(key_t key, int flag); 
返回 值 : Aa, EVA SVSNID;, Ante, we- 

15.6.1 方 说 明了 将 key 变 换 成 一 个 标识 符 的 规则， 并 且 讨 论 了 是 创 
建 一 个 新 队列 还 是 引用 一 个 现 有 队列 。 在 创建 新 队列 时 ， 要 初始 化 
msqid-ds 结 构 的 下 列 成 员 。 

*ipc-perm 结 构 按 15.6.2 世 中 所 述 进 行 初 始 化 。 该 结构 中 的 mode 成 员 
按 flag 中 的 相应 权限 位 设置 。 这 些 权 限 用 图 15-24 中 的 值 指定 。 

-msg qnum 、msg_lspid、msg_lrpid、msg_stime 和 msg_rtime 都 设置 
为 0。 

msg_ctime 设 置 为 当前 时 间 。 

“msg_qbytes 设 置 为 系统 限制 值 。 


APTA, msggetikX [el 3E fA BA GID 9 Hn, VRBE RT RATE 
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msgct 函 数 对 队列 执行 多 种 操作 。 它 和 另外 两 个 与 信号 量 及 共享 存 
储 有 关 的 函数 (semctl] 和 shmctl) 都 是 XSIIPC 的 类 似 于 ioct 的 函数 〈 亦 
即 垃圾 桶 函数 ) 。 

#include <sys/msg.h> 

int msgctl(int msgid, int cmd, struct msqid ds *buf); 

返回 值 : ARJ, EO; Amis, Ael- 

cmd 参 数 指定 对 msqid 指 定 的 队列 要 执行 的 命令 。 

IPC STAT 取 此 队列 的 msqid_ds 结 构 ， 并 将 它 存放 在 buf 指 向 的 结构 
中 o 

IPC SET 将 字段 msg, perm.uid ` msg perm.gid ^ msg perm.mode 和 
msg. qbytes M buf T& [8] F^] Zi; #4) 4 Ti] BI) Se PS DA, JI] TH EY msqid. ds 45 #4) 
中 。 此 命令 只 能 由 下 列 两 种 进程 执行 : 一 种 是 其 有 效用 户 ID 等 于 
msg_perm.cuid 或 msg_perm.uid， 另 一 种 是 具有 超级 用 户 特 权 的 进程 。 
只 有 超级 用 户 才能 增加 msg_qbytes 的 值 。 

IPC_RMID 从 系统 中 删除 该 消 恩 队列 以 及 仍 在 该 队列 中 的 所 有 数 
据 。 这 种 删除 立即 生效 。 仍 在 使 用 这 一 消息 队列 的 其 他 进程 在 它们 下 
一 次 试图 对 此 队列 进行 操作 时 ， 将 得 到 EIDRM 错 误 。 此 命令 只 能 由 下 
列 两 种 进程 执行 : 种 是 其 有 效用 户 ID 等 于 msg perm.cuid 或 
msg perm.uid; 另 一 种 是 具有 超级 用 户 特权 的 进程 。 

这 3 条 命令 (IPC_STAT、IPC_SET 和 IPC_RMID) 也 可 用 于 信和 号 量 
和 共享 存储 。 

i FAmsgsnd apa EIA BA P] nn o 


#include <sys/msg.h> 


int msgsnd(int msqid, const void *ptr, size t nbytes, int flag); 


WME: ARD, wo AE, e- 


正如 前 面 提 及 的 ， 每 个 消息 都 由 3 部 分 组 成 : 一 个 正 的 长 整 型 类 型 
的 字段 、 一 个 非 负 的 长 度 (nbytes) 以 及 实际 数据 字 节 数 (对 应 于 长 
EE) 。 消 息 总 是 放 在 队列 尾 端 。 

ptr 参 数 指 回 一 个 长 整 型 数 ， 它 包含 了 正 的 整 型 消 刀 类型， 其 后 紧 
接着 的 是 消息 数据 〈 者 nbytes 是 0， 则 无 消息 数据 ) 。 若 发 送 的 最 长 消 
已 是 512 字 世 的 ， 则 可 定义 下 列 结构 : 

struct mymesg { 


long mtype; /* positive message type */ 

char mtext[512]; /* message data, of length nbytes */ 
Js 
prit æ T f&lImymesgzT9B18tT » 接收 者 可 以 使 用 消息 类 型 以 
非 先进 先 出 的 次 序 取消 息 。 

某 些 平台 既 文 持 32 位 环境 ， 又 文 持 64 位 环境 。 这 影响 到 长 整 型 和 
指针 的 大 小 。 例 如 ， 在 64 位 SPARC 系 统 中 ，Solaris 人 允许 32 位 应 用 程序 和 
64 位 应 用 程序 同时 存在 。 如 有 果 一 个 32 位 应 用 程序 要 经 由 管道 或 套 接 字 
与 一 个 64 位 应 用 程序 交换 此 结构 ， 束 会 出 问题 。 因 为 在 32 位 应 用 程序 
中 ， 长 整 型 的 大 小 是 4 字 节 ， 而 在 64 位 应 用 程序 中 ， 长 整 型 的 大 小 是 8 
字 广 。 这 意味 着 ，32 位 应 用 程序 期 望 mtext 字 上 段 在 结构 起 始 地 址 后 的 第 4 
个 字 节 处 开始 ， 而 64 位 应 用 程序 则 期 望 mtext 字 段 在 结构 起 始 地 址 后 的 
第 8 个 字 节 处 开始 。 在 这 种 情况 下 ，64 位 应 用 程序 的 mtype 字 段 的 一 部 
分 会 被 32 位 应 用 程序 视 为 mtext 字 段 的 组 成 部 分 ， 而 32 位 应 用 程序 的 
mtext 字 上 段 的 前 4 个 字 节 会 被 64 位 应 用 程序 解释 为 mtype 字 段 的 组 成 部 
2j 
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调用 的 32 位 版 本 和 64 位 版 本 具有 不 同 的 入 口 点 。 这 些 系统 调用 知道 如 
何 处 理 32 位 应 用 程序 与 64 位 应 用 程序 的 通信 操作 ， 并 对 类 型 字段 做 了 
特殊 处 理 以 避免 它 干 扰 消息 的 数据 部 分 。 唯 一 的 潜在 问题 是 ， 当 64 位 


应 用 程序 向 32 位 应 用 程序 发 送 消 息 时 ， 如 果 它 在 8 字 节 类 型 字段 中 设置 
的 值 大 于 32 位 应 用 程序 中 4 字 节 类 型 字段 可 表示 的 值 ， 那 么 32 位 应 用 程 
序 在 其 mtype 字 段 中 得 到 的 将 是 一 个 截 短 了 的 类 型 值 。 

参数 flag 的 值 可 以 指定 为 IPC_NOWAIT 。 这 类 似 于 文件 oO 的 非 阻 
塞 JO 标 志 〈 见 14.2 节 ) 。 若 消息 队列 已 满 (或 者 是 队列 中 的 消息 总 数 
等 于 系统 限制 值 ， 或 队列 中 的 字 节 总 数 等 于 系统 限制 值 ) ， 则 指定 
IPC. NOWAIT f£ 4 msgsnd Xr. B} Hi $& 3& [B] EAGAIN ° 如果 没 有 指定 
IPC NOWAIT, ， 则 进程 会 一 直 阻 塞 到 : 有 空间 可 以 容纳 要 发 送 的 消 
AA; 或 者 从 系统 中 删除 了 此 队列 ; 或 者 捕捉 到 一 个 信和 号， 并 从 信号 处 
理 程 序 返 回 。 在 第 二 种 情况 下 ， 会 返回 EIDRM 错 误 (“标识 符 被 删 
ER") 。 最 后 一 种 情况 则 返回 EINTR 错 误 。 

注意 ， 对 删除 消息 队列 的 处 理 不 是 很 完善 。 因为 每 个 消息 队列 没 
有 维护 引用 计数 器 (打开 文件 有 这 种 计数 器 ) ， 所 以 在 队列 被 删除 以 
后 ， 仍 在 使 用 这 一 队列 的 进程 在 下 次 对 队列 进行 操作 时 会 出 错 返 回 。 
言 号 量 机 构 也 以 同样 方式 处 理 其 删除 。 相 反 ， 删 除 一 个 文件 时 ， 要 等 
到 使 用 该 文件 的 最 后 一 个 进程 关闭 了 它 的 文件 描述 符 以 后 ， 才 能 删除 
文件 中 的 内 容 。 

当 msgsnd 退 回 成 功 时 ， 消 上 息 队列 相关 的 msqid_ds 结 构 会 随 之 更 
新 ， 表 明 调用 的 进程 ID (msg_Ispid) 、 调 用 的 时 间 (msg stime) 以 及 
队列 中 新 增 的 消息 (msg qnum) 。 

msgrcv MBA 71] FR BUR IS A e 


#include <sys/msg.h> 


ssize_t msgrcv(int msqid, void *ptr, size_t nbytes, long type, int flag); 
返回 值 : ERD, REA REO KE, anita, e- 
和 msgsnd 一 样 ，ptr 参 数 指 癌 一 个 长 整 型 数 (其 中 存储 的 是 返回 的 
消息 类 型 ) ， 其 后 跟随 的 是 存储 实际 消息 数据 的 缓冲 区 。nbytes 指定 数 
据 缓 冲 区 的 长 度 。 阁 返回 的 消息 长 度 大 于 nbytes， 而 且 在 flag 中 设置 了 


MSG_NOERROR 位 ， 则 该 消息 会 被 截断 (在 这 种 情况 下 ， 没 有 通知 告 
诉 我 们 消息 截断 了 ， 消 息 被 截 去 的 部 分 被 丢弃 ) 。 如 果 没 有 设置 这 一 
标志 ， 而 消息 又 太 长 ， 则 出 错 返 回 E2BIG (消息 仍 留 在 队列 中 ) e 

参数 type 可 以 指定 想 要 哪 一 种 消息 。 

type == 0 返回 队列 中 的 第 一 个 消息 。 

type > 0 返回 队列 中 消 恩 类 型 为 type 的 第 一 个 消 恩 。 

type < 0 返回 队列 中 消息 类 型 值 小 于 等 于 type 绝对 值 的 消息 ， 如 末 
这 种 消 轧 有 者 干 个 ， 则 取 类 型 值 最 小 的 消息 。 

type 值 非 O 用 于 以 非 完 进 先 出 次 序 读 消息 。 例 如 ， 若 应 用 程序 对 消 
居 巍 予 优先 权 ， 那 么 type 就 可 以 是 优先 权 值 。 如 末 一 个 消 居 队列 由 多 个 
客户 进程 和 一 个 服务 器 进 程 使 用 ， 那么 type 字 段 可 以 用 来 包含 客户 进程 
的 进程 ID (只 要 进程 ID 可 以 存放 在 长 整 型 中 ) o 

可 以 将 flag 值 指定 为 IPC_NOWAIT， 使 控 作 不 阻 寨 ， 这 样 ， 如 果 没 
有 上 所 指定 类 型 的 消息 可 用 ， 则 msgrcv 返 回 -1，error 设 置 为 ENOMSG ° 
如 采 没 有 指定 IPC_NOWAIT， 则 进程 会 一 直 阻 塞 到 有 了 指定 类 型 的 消 
息 可 用 ， 或 者 从 系统 中 删除 了 此 队列 (返回 -1，error 设 置 为 
EIDRM) ， 或 者 捕捉 到 一 个 信号 并 从 信号 处 理 程序 返回 (这 会 导致 
msgrcv 返 回 -1，errno 设 置 为 EINTR) ° 

msgrcv 成 功 执行 时 ， 内 核 会 更 新 与 该 消息 队列 相关 联 的 msgid_ds 结 
构 ， 以 指示 调用 者 的 进程 ID (msg lrpid) 和 调用 时 间 (msg rtime) , 
并 指示 队列 中 的 消息 数 减 少 了 1 个 (msg qnum)» 

实例 : 消息 队列 与 全 双 工 管道 的 时 间 比 较 

如 车 需要 客户 进程 和 服务 器 进程 之 间 的 双向 数据 流 ， 可 以 使 用 消 
息 队 列 或 全 双 工 管道 。 (回忆 图 15-1， 通 过 UNIX 域 套 接 字 机 制 ， 见 
17.2， 可 以 使 全 双 工 管道 可 用 ， 而 某 些 平台 通过 pipe 函 数 提供 全 双 工 
管道 。) 


图 15-27 显 示 了 在 Solaris 上 3 种 技术 在 时 间 方 面 的 比较 ， 这 3 种 技术 
是 : 消息 队列 、 全 双 工 (STREAMS) 管道 和 UNIX 域 套 接 字 。 测 试 程 
序 先 创建 IPC 通 道 ， 调 用 fork， 然 后 从 父 进 程 向 子 进程 发 送 约 200 MB 数 
据 。 数 据 发 送 的 方式 是 ， 对 于 消息 队列 ， 调 用 100 000 次 msgsnd， 每 个 
消息 长 度 为 2 000 字 节 ; 对 于 全 双 工 管道 和 UNIX 域 套 接 字 ， 调 用 100 
000 次 write， 每 次 写 2 000 字 节 。 时 间 都 以 秒 为 单位 。 


消息 队列 5.09 


全 双 工 管道 5.24 
UNIX 域 套 接 字 7.49 


图 15-27 在 Solaris 上 3 种 IPC 的 时 间 比 较 

从 这 些 数字 中 可 见 ， 消 息 队 列 原来 的 实施 目的 是 提供 高 于 一 般 速 
度 的 IPC， 但 现在 与 其 他 形式 的 IPC 相 比 ， 在 速度 方面 已 经 没有 什么 差 
别 了 。 (在 原来 实施 消 恩 队列 时 ， 可 用 的 其 他 形式 的 IPC 束 只 有 半 双 工 
管道 这 一 种 。) 考虑 到 使 用 消息 队列 时 遇 到 的 问题 (15.6.47) , R 
们 得 出 的 结论 是 ， 在 新 的 应 用 程序 中 不 应 当 再 使 用 它们 。 


15.8 信号 量 


信号 量 与 已 经 介绍 过 的 IPC 机 构 (管道 、FIFO 以 及 消息 列队 ) 不 
同 。 它 是 一 个 计数 右 ， 用 于 为 多 个 进程 提供 对 共享 数据 对 象 的 访问 。 

Single UNIX Specification 包 括 了 男 外 一 套 信号 量 接口 ， 该 接口 原来 
是 实时 扩展 的 一 部 分 。 我 们 将 在 15.10 和 讨论 这 种 接口 。 

为 了 获得 共享 资源 ， 进 程 需要 执行 下 列 操 作 。 


(1) 测试 控制 该 资源 的 信号 量 。 
(2) 若 此 信号 量 的 值 为 正 ， 则 进程 可 以 使 用 该 资源 。 在 这 种 情况 
下 ， 进 程 会 将 信号 量 值 减 1， 表 示 它 使 用 了 一 个 资源 单位 。 
(3) 否则 ， 若 此 信号 量 的 值 为 0， 则 进程 进入 休眠 状态 ， 直 至 信 
号 量 值 大 于 0。 进 程 被 唤醒 后 ， 它 返回 至 步骤 (1) ° 
当 进程 不 再 使 用 由 一 个 信号 量 控制 的 共享 资源 时 ， 该 信号 量 值 增 
1。 如 果 有 进程 正在 休眠 等 待 此 信号 量 ， 则 唤醒 它们 。 
为 了 正确 地 实现 信号 量 ， 信 和 号 量 值 的 测试 及 减 1 操 作 应 当 是 原子 操 
作 。 为 此 ， 信 和 号 量 通 常 是 在 内 核 中 实现 的 。 
常用 的 信号 量 形式 被 称 为 二 元 信号 量 (binary semaphore) 。 它 控 
制 单个 资源 ， 其 初始 值 为 1°。 但 是 ， 一 般 而 言 ， 信 号 量 的 初 值 可 以 是 任 
意 一 个 正 值 ， 该 值 表明 有 多 少 个 共享 资源 单位 可 供 共享 应 用 。 
遗憾 的 是 ，XSI 信 号 量 与 此 相 比 要 复杂 得 多 。 以 下 3 种 特性 造成 了 
这 种 不 必要 的 复杂 性 。 
(1) 信号 量 并 非 是 单个 非 负 值 ， 而 必需 定义 为 含有 一 个 或 多 个 信 
号 量 值 的 集合 。 当 创建 信号 量 时 ， 要 指定 集合 中 信和 号 量 值 的 数量 。 
(2) 信号 量 的 创建 (semget) 是 独立 于 它 的 初始 化 (semctl) 
的 。 这 是 一 个 致命 的 缺点 ， 因 为 不 能 原子 地 创建 一 个 信号 量 集合 ， 并 
且 对 该 集合 中 的 各 个 信号 量 值 赋 初 值 。 
(3) 即使 没有 进程 正在 使 用 各 种 形式 的 XSI IPC， 它 们 仍然 是 存 
在 的 。 有 的 程序 在 终止 时 并 没有 释放 已 经 分 配给 它 的 信号 量 ， 所 以 我 
们 不 得 不 为 这 种 程序 担心 。 后 面 将 要 说 明 的 undo 功能 就 是 处 理 这 种 情 
况 的 。 
内 核 为 每 个 信号 量 集合 维护 着 一 个 semid_ds 结 构 : 


struct semid ds { 


struct ippc perm sem perm; /* see Section 15.6.2 */ 


unsigned short sem nsems; /* # of semaphores in set */ 


time t sem otime; /* last-semop() time */ 


time t sem ctime; /* last-change time */ 


Single UNIX Specification 定 义 了 上 面 所 示 的 各 字段 ， 但 是 具体 实现 
可 在 semid_ds 结 构 中 定义 添加 的 成 员 。 
每 个 信号 量 由 一 个 无 名 结构 表示 ， 它 至 少 包 舍 下 列 成 员 : 


struct { 
unsigned short semval; /* semaphore value, always >= 0 */ 
pid_t sempid; /* pid for last operation */ 
unsigned short semncnt; /* # processes awaiting 


semval>curval */ 


unsigned short semzcnt; /* # processes awaiting semval==0 */ 


» 
图 15-28 列 出 了 影响 信和 号 量 集 合 的 系统 限制 。 


典型 值 
FreeBSD 8.0 Linux 3. 2.0 Mac OS X 10. 6.8 Solaris 10 


任 一 信号 量 的 最 大 值 32 767 65 535 


任 一 信 SER 出 时 的 调整 值 32 767 32 767 


系统 中 信号 量 集 的 最 大 数量 128 128 
系统 中 号 量 的 最 大 数量 32 000 导出 的 
每 个 信号 量 集中 的 信号 量 的 最 大 数量 250 512 
系统 中 undo 结构 的 最 大 数量 32 000 导出 的 
每 个 undo 结构 中 undo 项 的 最 大 数量 无 限制 导出 的 
每 个 semop 调用 中 操作 的 最 大 数量 32 512 


图 15-28 影响 信号 量 的 系统 限制 


当 我 们 想 使 用 XSI 信 号 量 时 ， 首 先 需 要 通过 调用 了 芳 数 semget 来 获得 
一 个 信号 量 ID 。 


#include <sys/sem.h> 
int semget(key_t key, int nsems, int flag); 
REE: ERJ, REE SSID; 者 出 销 ， 返 回 -1 

15.6.1 市 说 明了 将 key 变 换 为 标识 符 的 规则 ， 讨 论 了 是 创建 一 个 新 
集合 ， 还 是 引用 一 个 现 有 集合 。 创 建 一 个 新 集合 时 ， 要 对 semid_ds 结 构 
的 下 列 成 员 赋 初 值 。 

* 按 15.6.2 太 中 所 述 ， 初 始 化 ipc_perm 结 构 。 该 结构 中 的 mode 成 员 补 
设置 为 flag 中 的 相应 权限 位 。 这 些 权 限 是 用 图 15-24 中 的 值 设 置 的 。 

“sem_otime 设 置 为 0。 

“sem_ctime 设 置 为 当前 时 间 。 

“sem_nsems 设 置 为 nsems ° 

nsems 是 该 集合 中 的 信号 量 数 。 如 果 是 创建 新 集合 (一 般 在 服务 器 
进程 中 ) ， 则 必须 指定 nsems。 如 果 是 引用 现 有 集合 (一 个 客户 进 
ke) ， 则 将 nsems 指 定 为 0。 

semct 函数 包含 了 多 种 信号 量 操作 。 


#include <sys/sem.h> 


int semctl(int semid, int semnum, int cmd, ... /* union semun arg */); 
返回 值 ， (LF) 
第 4 个 参数 是 可 选 的 ， 是 否 使 用 取决 于 所 请 求 的 命令 ， 如 果 使 用 该 
参数 ， 则 其 类 型 是 semun， 它 是 多 个 命令 特定 参数 的 联合 (union) : 

union semun { 

int val; /* for SETVAL */ 

struct semid ds *buf; /* for IPC STAT and IPC SET */ 

unsigned short *array; /* for GETALL and SETALL */ 
}; 
注意 ， 这 个 选项 参数 是 一 个 联合 ， 而 非 指向 联合 的 指针 。 


通常 应 用 程序 必须 定义 semun 联 合 。 然 而 ， 在 FreeBSD 8.0 Ħ , 
semun 已 经 由 <sys/sem.h> 为 我 们 定义 好 了 。 

cmd 参 数 指定 下 列 10 种 命令 中 的 一 种 ， 这 些 命令 是 运行 在 semid 指 
定 的 信号 量 集合 上 的 。 其 中 有 5 种 命令 是 针对 一 个 特定 的 信号 量 值 的 ， 
它们 用 semnum 指 定 该 信号 量 集 合 中 的 一 个 成 员 。semnum 值 在 0 和 
nsems-1 之 间 ， 包 括 0 和 nsems-1。 

IPC STAT 对 此 集合 取 semid_ds 结 构 ， 并 存储 在 由 arg.buf 指 癌 的 结 
构 中 。 

IPC SET 按 arg.buf 指 辣 的 结构 中 的 值 ， 设 置 与 此 集合 相关 的 结构 
中 的 sem_perm.uid、sem_perm.gid 和 sem_perm.mode 字 段 。 此 命令 只 能 
由 两 种 进程 执行 : 种 是 其 有 效用 户 ID 等 于 sem_perm.cuid 或 
sem_perm.uid 的 进程 ; 另 一 种 是 具有 超级 用 户 特权 的 进程 。 

IPC RMID 从 系统 中 删除 该 信号 量 集合 。 这 种 删除 是 立即 发 生 
的 。 删 除 时 仍 在 使 用 此 信号 量 集 合 的 其 他 进程 ， 在 它们 下 次 试图 对 此 
信号 量 集合 进行 操作 时 ， 将 出 错 返 回 EIDRM。 此 命令 只 能 由 两 种 进程 
执行 : 一 种 是 其 有 效用 户 ID 等 于 sem_perm.cuid 或 sam_perm.uid 的 进程 ; 
男 一 种 是 具有 超级 用 户 特 权 的 进程 。 

GETVAL 返回 成 员 semnum 的 semval 值 。 

SETVAL 设置 成 员 semnum 的 semval 值 。 该 值 由 arg.val 指 定 。 

GETPID 返回 成 员 semnum 的 sempid 值 。 

GETNCNT 返回 成 员 semnum 的 semncnt 值 。 

GETZCNT 返回 成 员 semnum 的 semzcnt 值 。 

GETALL 取 该 集合 中 所 有 的 信和 号 量 值 。 这 些 值 存储 在 arg.array 指 问 
的 数组 中 。 

SETALL 将 该 集合 中 所 有 的 信号 量 值 设置 成 arg.array 指 癌 的 数组 中 
的 值 。 


对 于 除 GETALL 以 外 的 所 有 GET 命 令 ，semctl 画 数 都 返回 相应 值 。 
对 于 其 他 命令 ， 帮 成功 则 返回 值 为 0， 者 出 错 ， 则 设置 ermno 并 返回 -1。 
函数 semop 目 动 执行 信号 量 集 合 上 的 操作 数组 。 


#include <sys/sem.h> 


int semop(int semid, struct sembuf semoparray[], size t nops); 
返回 值 : Ak, Reo; AES, we- 
$4Xsemoparrayze “fa tt, Eta — A HisembufZif4 3e naa 97 
量 操作 数组 : 


struct sembuf { 


unsigned short sem num; /* member # in set (0, 1, ..., 
nsems-1 */ 
short sem Op; /* operation(negative, O,or 


pasitive */) 

short sem flg; /* IPC. NOWAIT, 
SEM UNDO */ 

J 

参数 nops 规 定 该 数组 中 操作 的 数量 (元 素数 ) 

对 集合 中 每 个 成 员 的 操作 由 相应 的 sem. op 值 规定 。 此 值 可 以 是 负 
值 、0 或 正 值 。 (下 面 的 讨论 将 提 到 信号 量 的 “undo” 标 志 。 此 标志 对 应 
于 相应 的 sem_flg 成 员 的 SEM_UNDO 位 。) 

(1) 最 易于 人 处理 的 情况 是 sem op 为 正 值 。 这 对 应 于 进程 释放 的 
占用 的 资源 数 。sem_op 值 会 加 到 信号 量 的 仁 上 。 如 果 指 定 了 undo 标 
志 ， 则 也 从 该 进程 的 此 信号 量 调整 值 中 减 去 sem_op。 

(2) 若 sem_op 为 负 值 ， 则 表示 要 获取 由 该 信号 量 控制 的 资源 。 

如 若 该 信号 量 的 值 大 于 等 于 sem op 的 绝对 值 (具有 所 需 的 资 
源 ) ， 则 从 信和 号 量 值 中 减 去 sem_op 的 绝对 值 。 这 能 保证 信号 量 的 结 


值 大 于 等 于 0。 如 果 指 定 了 undo 标志 ， 则 sem op 的 绝对 值 也 加 到 该 进 
程 的 此 信和 号 量 调整 值 上 。 

如 果 信 号 量 值 小 于 sem_op 的 绝对 值 《资源 不 能 满足 要 求 ) ， 则 适 
用 下 列 条 件 。 

a. 车 指定 了 IPC_NOWAIT， 则 semop 出 错 返 回 EAGAIN ° 

b. 若 未 指定 IPC_NOWAIT， 则 该 信号 量 的 semncnt 值 加 1 (因为 调 
用 进程 将 进入 休眠 状态 ) ， 然 后 调用 进程 被 挂 起 直至 下 列 事件 之 一 发 
HE o 


i， 此 信号 量 值 变 成 大 于 等 于 sem_op 的 绝对 值 ( 即 某 个 进程 已 释放 
些 资源 ) 。 此 信号 量 的 semncnt 值 减 1 (AN EARS) ， 并 且 从 
量 值 中 减 去 sem_op 的 绝对 值 。 

如 果 指 定 了 undo 标 志 ， 则 sem_op 的 绝对 值 也 加 到 该 进程 的 此 信和 号 
量 调整 值 上 。 

和 让， 从 系统 中 删除 了 此 信号 量 。 在 这 种 情况 下 ， 画 数 出 销 返 回 
EIDRM ? 

过 .进程 捕捉 到 一 个 信号 ， 并 从 信和 号 处 理 程序 返回 ， 在 这 种 情况 
下 ， 此 信和 号 量 的 semncnt 值 减 1 (因为 调用 进程 不 再 等 等) , FR A a etc 
错 返 回 EINTR。 

(3) 若 sem_op 为 0， 这 表示 调用 进程 希望 等 竺 到 该 信号 量 值 变 成 


TR 
= 


fi 
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如 果 信 和 号 量 值 非 0， 则 适用 下 列 条 件 。 

a， 若 指定 了 IPC_NOWAIT， 则 出 错 返 回 EAGAIN ° 

b. 若 未 指定 [PC_NOWAIT， 则 该 信号 量 的 semzent 值 加 1 (因为 
调用 进程 将 进入 休眠 状态 ) ， 然 后 调用 进程 被 挂 起 ， 直 至 下 列 的 一 个 
事件 发 生 。 


i， 此 信号 量 值 变 成 0。 此 信号 量 的 semzcnt 值 减 1 (因为 调用 进程 已 
结束 等 待 ) 。 

和 让， 从 系统 中 删除 了 此 信号 量 。 在 这 种 情况 下 ， 郴 数 出 错 返回 
EIDRM 。 

过 .进程 捕捉 到 一 个 信号 ， 并 从 信和 号 处 理 程序 返回 。 在 这 种 情况 
下 ， 此 信号 量 的 semzcnt 值 减 1 《因为 调用 进程 不 再 等 待 ) . FFA eet 
错 返 回 EINTR ° 

semop 芳 数 具 有 原子 性 ， 它 或 者 执行 数组 中 的 所 有 操作 ， 或 者 一 个 
也 不 做 。 

exit 时 的 信号 量 调 整 

正如 前 面 提 到 的 ， 如 果 在 进程 终止 时 ， 它 占用 了 经 由 信号 量 分 配 
的 资源 ， 那 么 就 会 成 为 一 个 问题 。 无 论 何 时 只 要 为 信号 量 操作 指定 了 
SEM_UNDO 标 志 ， 然 后 分 配 资源 (sem_op 值 小 于 0) ， 那 么 内 核 就 会 
记 住 对 于 该 特定 信号 量 ， 分 配给 调用 进程 多 少 资 源 (sem_op 的 绝对 
值 ) 。 当 该 进程 终止 时 ， 不 论 自 愿 或 者 不 自愿 ， 内 核 都 将 检验 该 进程 
是 否 还 有 尚未 处 理 的 信号 量 调整 值 ， 如 果 有 ， 则 按 调整 值 对 相应 信和 号 
量 值 进行 处 理 。 

如 果 用 市 SETVAL 或 SETALL 命 令 的 semctl 设 置 一 个 信和 号 量 的 值 ， 
则 在 所 有 进程 中 ， 该 信号 量 的 调整 值 都 将 设置 为 0。 

实例 : 信号 量 、 记 录 锁 和 互 斥 量 的 时 间 比 较 

如 果 在 多 个 进程 间 共 享 一 个 资源 ， 则 可 使 用 这 3 种 技术 中 的 一 种 来 
协调 访问 。 我 们 可 以 使 用 映射 到 两 个 进程 地 址 空间 中 的 信号 量 、 记 录 
锁 或 者 互 斥 量 。 对 这 3 种 技术 两 两 之 间 在 时 间 上 的 差别 进行 比较 是 有 益 
的 。 

若 使 用 信号 量 ， 则 先 创建 一 个 包含 一 个 成 员 的 信号 量 集合 ， 然 后 
将 该 信号 量 值 初始 化 为 1。 为 了 分 配 资源 ， 以 sem op 为 -1 调用 


semop。 为 了 释放 资源 ， 以 sem_op 为 +1 调 用 semop“。 对 每 个 探 作 都 指定 
SEM_UNDO， 以 处 理 在 未 释放 资源 条 件 下 进程 终止 的 情况 。 

若 使 用 记录 锁 ， 则 先 创 建 一 个 空 文件 ， 并 且 用 该 文件 的 第 一 个 字 
TH (无 需 存在 ) 作为 锁 字 节 。 为 了 分 配 资源 ， 先 对 该 字 节 获得 一 个 写 
锁 。 释 放 该 资源 时 ， 则 对 该 字 节 解锁 。 记 录 锁 的 性 质 确保 了 当 一 个 锁 
的 持 有 者 进程 终止 时 ， 内 核 会 自动 释放 该 锁 。 

若 使 用 互 斥 量 ， 需 要 所 有 的 进程 将 相同 的 文件 映射 到 它们 的 地 址 
空间 里 ， 并 且 使 用 PTHREAD_PROCESS_SHARED 互 斥 量 属性 在 文件 
的 相同 偏 移 处 初始 化 互 斥 量 。 为 了 分 配 资源 ， 我 们 对 互 斥 量 加 锁 。 为 
了 释放 锁 ， 我 们 解锁 互 斥 量 。 如 采 一 个 进程 没有 释放 互 斥 量 而 终止 ， 
恢复 将 是 非常 困难 的 ， 除 非 我 们 使 用 鲁 棱 互 不 量 〈 回 忆 12.4.1 记 中 讨论 
Hpthread_mutex_consistent2{) 。 

图 15-29 显 示 了 在 Linux 上 ， 使 用 这 3 种 不 同 技术 进行 锁 操 作 所 需 的 
时 间 。 在 每 一 种 情况 下 ， 资 源 都 被 分 配 、 释 放 1 000 000 次 。 这 同时 由 3 
个 不 同 的 进程 执行 。 图 15-29 中 所 示 的 时 间 是 3 个 进程 的 总 计 ， 单 位 是 
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在 Linux 上 ， 记 录 锁 比 信 号 量 快 ,但 是 共 至 存储 中 的 互 不 量 的 性 能 
比 信号 量 和 记录 锁 的 都 要 优越 。 如 有 果 我 们 能 单一 资源 加 锁 ， 并 且 不 需 
要 XSI 信 和 号 量 的 所 有 人 花哨 功能 ， 那 么 记录 锁 将 比 信号 量 要 好 。 原 因 是 它 
使 用 起 来 更 简单 、 速 度 更 快 (在 这 个 平台 上 ) ， 当 进程 终止 时 系统 会 


管理 遗留 下 来 的 锁 。 尽 管 对 于 这 种 平台 来 说 ， 在 共享 存储 中 使 用 互 不 
量 是 一 个 更 快 的 选择 ,但 是 我 们 依然 喜欢 使 用 记录 锁 ， 除 非 要 特别 考 
虚 性 能 。 这 样 做 有 两 个 原因 。 首 先 ， 在 多 个 进程 间 共 享 的 内 存 中 使 用 
互 不 量 来 恢复 一 个 终止 的 进程 更 难 。 其 次 ， 进 程 共 享 的 互 不 量 属性 还 
没有 得 到 普遍 支持 。 在 Single UNIX Specification 的 老 版 本 中 ， 这 是 可 选 
的 。 尺 管 在 SUSv4 中 依然 是 可 迹 的 ， 但 是 现在 ， 所 有 遵循 XSI 的 实现 都 
要 求 使 用 它 。 

在 本 书 讨 论 的 4 个 平台 中 ， 只 有 Linux 3.2.0 和 Solaris 10 当 前 支持 进 
程 共享 的 互 斥 量 属性 。 


15.9 共享 存储 


共享 存储 允许 两 个 或 多 个 进程 共享 一 个 给 定 的 存储 区 。 因 为 数据 
不 需要 在 客户 进程 和 服务 器 进程 之 间 复 制 ， 所 以 这 是 最 快 的 一 种 IPC © 
使 用 共享 存储 时 要 掌握 的 唯一 窍门 是 ， 在 多 个 进程 之 间 同 步 访问 一 个 
给 定 的 存储 区 。 若 服务 器 进程 正在 将 数据 放 入 共享 存储 区 ， 则 在 它 做 
完 这 一 操作 之 前 ， 客 户 进 程 不 应 当 去 取 这 些 数 据 。 通 常 ， 信 号 量 用 于 
同步 共享 存储 访问 。 〈 不 过 正如 前 节 最 后 部 分 所 述 ， 也 可 以 用 记录 锁 
或 互 斥 量 。) 

Single UNIX Specification 在 其 共享 存储 对 象 选 项 中 包括 了 访问 共享 
存储 的 蔡 代 接口 ， 这 些 接口 源 于 实时 扩展 。 本 书 不 讨论 这 些 接 口 。 

我 们 已 经 看 到 了 共享 存储 的 一 种 形式 ， 就 是 在 多 个 进程 将 同一 个 
文件 映射 到 它们 的 地 址 空间 的 时 候 。XSI 共享 存储 和 内 存 映射 的 文件 的 
不 同 之 处 在 于 ， 前 者 没有 相关 的 文件 。XSI 共享 存储 段 是 内 存 的 匿名 


段 。 


内 核 为 每 个 共享 存储 段 维护 着 一 个 结构 ， 该 结构 至 少 要 为 每 个 共 
享 存储 段 包含 以 下 成 员 : 
struct shmid ds { 


struct ipc. perm shm perm; /* see Section 15.6.2 */ 


size t shm segsz;  /* size of segment in bytes */ 
pid t shm lpid;  /* pid of last shmop() */ 

pid t shm cpid;  /* pid of creator */ 

shmatt t shm nattch; /* number of current attaches */ 
time t shm atime;  /* last-attach time */ 

time t shm dtime;  /*last-detach time */ 

time t shm ctime; /* last-change time */ 


(按照 支持 共享 存储 段 的 需要 ， 每 种 实现 会 增加 其 他 结构 成 
员 。) 
shmatt_t 类 型 定义 为 无 从 号 整 型 ， 它 至 少 与 unsigned short 一 样 大 。 
图 15-30 列 出 了 影响 共享 存储 的 系统 限制 。 


典型 值 


FreeBSD 8.0 Linux 3. 2.0 Mac OS X 10. 6.8 Solaris 10 


共享 存储 段 的 最 大 字 节 长 度 33 554 432 4 194 304 导出 的 
共享 存储 段 的 最 小 字 节 长 度 1 1 1 
系统 中 共享 存储 段 的 最 大 段 数 192 32 128 
每 个 进程 共享 存储 段 的 最 大 段 数 128 8 128 


图 15-30 影响 共享 存储 的 系统 限制 
调用 的 第 一 个 函数 通常 是 shmget， 它 获得 一 个 共享 存储 标识 符 。 
#include <sys/shm.h> 
int shmget(key. t key, size t size, int flag); 
返回 值 : ERJ, RES AID; 者 出 错 ， 返 回 -1 


15.6.1 市 说 明了 将 key 变 换 成 一 个 标识 符 的 规则 ， 以 及 是 创建 一 个 
新 共享 存储 段 ， 还 是 引用 一 个 现 有 的 共享 存储 段 。 当 创建 一 个 新 段 
时 ， 初 始 化 shmid_ds 结 构 的 下 列 成 员 。 

“ipc_perm 结 构 按 15.6.2 节 中 所 壕 进 行 初始 化 。 该 结构 中 的 mode 按 
flag 中 的 相应 权限 位 设置 。 这 些 权 限 用 图 15-24 中 的 值 指定 。 

“shm_lpid、shm_nattach、shm_atime 和 shm_dtime 都 设置 为 0。 

shm_ctime 设 置 为 当前 时 间 。 

“shm_segsz 设 置 为 请 求 的 size ° 

参数 size 是 该 共享 存储 段 的 长 度 ， 以 字 布 为 单位 。 实 现 通常 将 其 辐 
上 取 为 系统 页 长 的 整 倍数 。 但 是 ， 在 应 用 指定 的 size 值 并 非 系统 页 长 的 
整 倍 数 ， 那 么 最 后 一 页 的 余下 部 分 是 不 可 使 用 的 。 如 果 正 在 创建 一 个 
新 段 (通常 在 服务 器 进程 中 ) ， 则 必须 指定 其 size。 如 果 正 在 引用 一 个 
现存 的 段 〈 一 个 客户 进程 ) ， 则 将 size 指 定 为 0。 当 创建 一 个 新 段 时 ， 
段 内 的 内 容 初始 化 为 0。 

shmct 函 数 对 共享 存储 段 执行 多 种 操作 。 


#include <sys/shm.h> 


int shmctl(int shmid, int cmd, struct shmid_ds *buf); 
REE: Aa, Wel; Awe, el- 
cmd 参 数 指定 下 列 5 种 命令 中 的 一 种 ， 使 其 在 shmid 指 定 的 段 上 执 


IPC STAT 取 此 上 段 的 shmid_ds 结 构 ， 并 将 它 存 储 在 由 buf 指 问 的 结构 


IPC SET 按 buf 指 向 的 结构 中 的 值 设置 与 此 共享 存储 段 相关 的 
shmid ds 结构 中 的 下 列 3 个 字段 : shm perm.uid ^ shm perm.gid 和 
shm_perm.mode。 此 命令 只 能 由 下 列 两 种 进程 执行 : 一 种 是 其 有 效用 户 
ID 等 于 shm_perm.cuid 或 shm_perm.uid 的 进程 ; 另 一 种 是 具有 超级 用 户 
特权 的 进程 。 


IPC RMID 从 系统 中 删除 该 共享 存储 段 。 因 为 每 个 共享 存储 段 维 
护 着 一 个 连接 计数 (shmid_ds 结 构 中 的 shm_nattch 字 段 )， 所 以 除非 使 
用 该 段 的 最 后 一 个 进程 终止 或 与 该 段 分 离 ， 否 则 不 会 实际 上 删除 该 存 
储 段 。 不 管 此 段 是 否 仍 在 使 用 ， 该 段 标 识 符 都 会 被 立即 删除 ， 所 以 不 
能 再 用 shmat 与 该 段 连 接 。 此 命令 只 能 由 下 列 两 种 进程 执行 : 一 种 是 
其 有 效用 户 ID 等 于 shm_perm.cuid 或 shm_perm.uid 的 进程 ， 男 一 种 是 
具有 超级 用 户 特 权 的 进程 。 

Linux 和 Solaris 提 供 了 另外 两 种 命令 ， 但 它们 并 非 Single UNIX 
Specification 的 组 成 部 分 。 

SHM_LOCK 在 内 存 中 对 共享 存储 段 加 锁 。 此 命令 只 能 由 超级 用 户 
执行 。 

SHM_UNLOCK 解锁 共享 存储 段 。 此 命令 只 能 由 超级 用 户 执 行 。 

一 旦 创建 了 一 个 共享 存储 段 ， 进 程 就 可 调用 shmat 将 其 连接 到 它 的 
地 址 空间 中 。 


#include <sys/shm.h> 


void *shmat(int shmid, const void *addr, int flag); 
返回 值 : AA, WEES eR, 若 出 错 ， 返 回 -1 

共享 存储 段 连 接 到 调用 进程 的 哪个 地 址 上 与 addr 参 数 以 及 flag 中 是 
否 指 定 SHM_RND 位 有 关 。 

“如 采 addr 为 0， 则 此 段 连 接 到 由 内 核 选 择 的 第 一 个 可 用 地 址 上 。 这 
是 推荐 的 使 用 方式 。 

“如果 addr 非 0， 并 且 没 有 指定 SHM_RND ， 则 此 段 连 接 到 addr 所 指 
定 的 地 址 上 。 

如果 addr 非 0， 并 且 指 定 了 SHM_RND， 则 此 段 连接 到 (addr-(addr 
mod SHMLBA)) 所 表示 的 地 址 上 。SHM_RND 命 令 的 意思 是 “ 取 整 ”。 
SHMLBA 的 意思 是 “ 低 边 界 地 址 倍数 ”， 它 总 是 2 的 乘 方 。 该 算式 是 将 地 
址 向 下 取 最 近 1 个 SHMLBA 的 倍数 。 


除非 只 计划 在 一 种 硬件 上 运行 应 用 程序 (这 在 当今 是 不 大 可 能 
HJ) ， 和 否则 不 应 指定 共享 存储 段 所 连接 到 的 地 址 。 而 是 应 当 指定 addr 为 
0， 以 便 由 系统 选择 地 址 。 

如 果 在 flag 中 指定 了 SHM_RDONLY 位 ， 则 以 只 读 方 式 连 接 此 上 段 ， 
否则 以 读 写 方式 连接 此 段 。 

shmat 的 返回 值 是 该 段 所 连接 的 实际 地 址 ， 如 果 出 错 则 返回 -1。 如 
果 shmat 成 功 执行 ， 那 么 内 核 将 使 与 该 共享 存储 段 相关 的 shmid_ds 结 构 
中 的 shm_nattch 计 数 器 值 加 1 。 

当 对 共享 存储 段 的 操作 已 经 结束 时 ， 则 调用 shmdt 与 该 段 分 离 。 
注意 ， 这 并 不 从 系统 中 删除 其 标识 符 以 及 其 相关 的 数据 结构 。 该 标识 
符 仍然 存在 ， 直 至 某 个 进程 (一 般 是 服务 器 进程 ， 带 IPC_RMID 命 令 的 
调用 shmctl 特 地 删除 它 为 止 。 


#include <sys/shm.h> 


int shmdt(const void *addr); 
返回 值 : 者 成 功 ， 返 回 0; AE, wel- 

addr 参 数 是 以 前 调用 shmat 时 的 返回 值 。 如 果 成 功 ，shmdt 将 使 相关 
shmid_ds 结 构 中 的 shm_nattch 计 数 器 值 减 1。 

实例 

内 核 将 以 地 址 0 连接 的 共享 存储 段 放 在 什么 位 置 上 与 系统 密切 相 
天 。 图 15-31 中 的 程序 打印 了 一 些 特定 系统 存放 各 种 类 型 的 数据 的 位 置 
信息 。 


Asa 


#include "apue.h" 
#include «sys/shm.h» 


#define ARRAY SIZE 40000 
#define MALLOC SIZE 100000 


#define SHM SIZE 100000 

#define SHM MODE 0600 /* user read/write */ 

char array [ARRAY SIZE]; /* uninitialized data = bss */ 
int 


main (void) 


{ 


int shmid; 
char *ptr, *shmptr; 
printf ("array[] from $p to %p\n", (void *)&array[0], 
(void *)&array[ARRAY SIZE]); 
printf("stack around %p\n", (void *)&shmid); 
if ((ptr = malloc(MALLOC SIZE)) == NULL) 
err sys("malloc error"); 
printf("malloced from $p to %p\n", (void *)ptr, 
(void *)ptr-*MALLOC SIZE); 
if ((shmid = shmget(IPC PRIVATE, SHM SIZE, SHM MODE)) < 0) 
err sys("shmget error"); 
if ((shmptr = shmat(shmid, 0, 0)) == (void *)-1) 
err sys("shmat error"); 
printf("shared memory attached from $p to $pWMn", (void *)shmptr, 


(void *)shmptr+SHM SIZE); 


if (shmctl(shmid, IPC RMID, 0) « 0) 
err sys("shmctl error"); 


exit(0); 


图 15-31 打印 各 种 类 型 的 数据 存放 的 位 置 


在 一 个 基于 Intel 的 64 位 Linux 系 统 上 运行 此 程序 ， 其 输出 如 下 : 
$ ./a.out 

array[] from 0x6020c0 to 0x60bd00 

stack around 0x7fff957b146c 

malloced from 0x9e3010 to Ox9fb6bO0 

shared memory attached from 0x7fba578ab000 to 0x7fba578c36a0 


图 15-32 显 示 了 这 种 情况 ， 这 与 图 7-6 中 所 示 的 典型 存储 区 布局 类 
似 。 注 意 ， 共 享 存储 段 紧 靠 在 栈 之 下 。 

回忆 一 下 mmap 函 数 ( 见 14.8 节 ) ， 它 可 将 一 个 文件 的 若干 部 分 映 
射 至 进程 地 址 空间 。 这 在 概念 上 类 似 于 用 shmat XSI IPC BOE — 7 
共享 存储 段 。 两 者 之 间 的 主要 区 别 是 ， 用 mmap 映 射 的 存储 段 是 与 文件 
相关 联 的 ， 而 XSI 共 享 存 储 段 则 并 无 这 种 关联 。 


高 地 址 命令 行 参数 
和 环境 变量 
Hi 0x7f£ff957b146c 


0x7£ba578c36a0 
共享 存储 100,000 字 节 的 共享 存储 
0x7fba578ab000 
0x0000009fb6b0 
100,000 *£ 158, malloc 
0x0000009e3010 
: 0x00000060bd00 
未 初始 化 的 数据 40,000 字 节 的 array[ ] 
(bss) 0x0000006020c0 


已 初始 化 的 数据 
正文 
低地 址 


图 15-32 在 基于 Intel 的 Linux 系 统 上 的 存储 区 布局 


实例 : /dev/zero 的 存储 映射 

共享 存储 可 由 两 个 不 相关 的 进程 使 用 。 但 是 ， 如 果 进 程 是 相关 
的 ， 则 某 些 实现 提供 了 一 种 不 同 的 技术 。 

下 面 说 明 的 技术 用 于 FreeBSD 8.0 ` Linux 3.2.0 和 Solaris 10。 Mac 
OS X 10.6.8 当 前 并 不 文 持 将 字符 设备 映射 至 进程 地 址 空间 。 


在 读 设 备 /dev/zero 上 时 ， 该 设备 是 0 字 市 的 无 限 资源 。 它 也 接收 写 问 
它 的 任何 数据 ， 但 又 忽略 这 些 数据 。 我 们 对 此 设备 作为 IPC 的 兴趣 在 
于 ， 当 对 其 进行 存储 映射 时 ， 它 具有 一 些 特殊 性 质 。 

“创建 一 个 未 命名 的 存储 区 ， 其 长 度 是 mmap 的 第 二 个 参数 ， 将 其 向 
上 取 整 为 系统 的 最 近 页 长 。 

“存储 区 都 初始 化 为 0。 

“如 果 多 个 进程 的 共同 祖先 进程 对 mmap 指 定 了 MAP_SHARED 标 
志 ， 则 这 些 进程 可 共享 此 存储 区 。 

图 15-33 中 的 程序 是 使 用 此 特殊 设备 的 一 个 例子 。 


#include "apue.h" 


finclude «fcntl.h» 
#include <sys/mman.h> 


#define NLOOPS 1000 
#define SIZE sizeof(long) /* size of shared memory area */ 


static int 
update(long *ptr) 
{ 


return ((*ptr) ++); /* return value before increment */ 


int 

main (void) 

{ 
int fd, i, counter; 
pid t pid; 
void *area; 


if ((fd = open("/dev/zero", O RDWR)) < 0) 
err sys("open error"); 
if ((area = mmap(0, SIZE, PROT READ | PROT WRITE, MAP SHARED, 


fd, 0)) == MAP FAILED) 
err sys("mmap error"); 
close (fd); /* can close /dev/zero now that it's mapped */ 


TELL WAIT(); 


if ((pid = fork()) « 0) { 
err sys("fork error"); 


) else if (pid > 0) 1 /* parent */ 
for (i = 0; i < NLOOPS; i += 2) { 
if ((counter = update((long *)area)) != i) 


err quit ("parent: expected Sd, got $d", i, counter); 


TELL CHILD (pid); 
WAIT CHILD(); 
} 
} else { /* child */ 
for (i = 1; i < NLOOPS + 1; i += 2) { 
WAIT PARENT (); 


if ((counter = update((long *)area)) != i) 
err quit("child: expected $d, got %d", i, counter); 


TELL PARENT (getppid()); 


exit(0); 


图 15-33 在 父 进程 、 子 进程 之 间 使 用 /dewzero 的 存储 映射 TO 的 IPC 


该 程序 打开 此 /dewzero 设 备 ， 然 后 指定 长 整 型 的 长 度 调用 mmap。 
注意 ， 一 旦 存储 区 映射 成 功 ， 我 们 束 要 关闭 (close) 此 设备 。 然 后 ， 
进程 创建 一 个 子 进程 。 因 为 在 调用 mmap 时 指定 了 MAP_SHARED， 所 
以 一 个 进程 写 到 存储 映射 区 的 数据 可 被 另 一 进程 见 到 。 (如 果 已 指定 
MAP_PRIVATE， 则 此 程序 不 能 工作 。) 

然后 ， 父 进程 、 子 进程 交替 运行 ， 它 们 使 用 8.9 市 中 的 同步 贸 数 各 
目 对 共 至 存储 映射 区 中 的 长 整 型 数 加 1。 存 储 映射 区 由 mmap 初 始 化 为 
0。 父 进程 完 对 它 进行 增 1 操作 ， 使 其 成 为 1， 然 后 子 进程 对 其 进行 增 1 
操作 ， 使 其 成 为 2， 然 后 父 进程 使 其 成 为 ?3， 依 此 类 推 。 注 意 ， 当 在 
update 函 数 中 对 长 整 型 值 增 1 时 ， 因 为 增加 的 是 其 值 ， 而 不 是 指针 ， 所 
以 必须 使 用 括号 。 

以 上 述 方 式 使 用 /devzero 的 优点 是 : 在 调用 mmap 创建 映射 区 之 
前 ， 无需 存 在 一 个 实际 文件 。 映 射 /dev/zero 自动 创建 一 个 指定 长 度 的 
ITX o PR BOR ABU ae: 它 只 在 两 个 相关 进程 之 间 起 作用 。 但 在 
相关 进程 之 间 使 用 线程 可 能 更 为 简单 有 效 〈 见 第 11 章 和 第 12 章 ) 。 注 
意 ， 无 论 使 用 哪 一 种 技术 ， 都 需 对 共享 数据 进行 同步 访问 。 

实例 :匿名 存储 映射 

很 多 实现 提供 了 一 种 类 似 于 /dev/zero 的 设施 ， 称 为 匿名 存储 映 
射 。 为 了 使 用 这 种 功能 ， 要 在 调用 mmap 时 指定 MAP_ANON 标 志 ， 并 
将 文件 描述 符 指定 为 -1。 结果 得 到 的 区 域 是 匿名 的 (因为 它 并 不 通过 
一 个 文件 描述 符 与 一 个 路 径 名 相 结 合 ， 并 且 创 建 了 一 个 可 与 后 代 进 
程 共 享 的 存储 区 。 

本 书 讨论 的 4 种 平台 都 文 持 匿 名 存储 映射 设施 。 但 是 注意 ，Linux 
为 此 设备 定义 了 MAP ANONYMOUS 标志 ， 并 将 MAP_ANON 标 志 定 
义 为 与 它 相 同 的 值 以 改善 应 用 的 可 移植 性 。 


为 使 图 15-33 中 的 程序 应 用 这 个 设施 ， 我 们 对 它 做 了 3 处 修改 : 
(a) 删除 了 /dev/zero 的 open 语 句 ， (b) 删除 了 fd 的 close 语 句 ， (c) 
将 mmap 调 用 修改 如 下 : 
if ((area = mmap(0, SIZE, PROT READ | PROT WRITE, 
MAP ANON | MAP SHARED, -1 0) == 
MAP FAILED) 
eval QFE T MAP. ANON FI, JEEOCTETIEDIUT D Be A-1° Fd 
15-33 中 的 程序 的 其 余部 分 没 变 。 
最 后 两 个 实例 说 明了 在 多 个 无 天 进程 之 间 如 何 使 用 共享 存储 段 。 
如 果 在 两 个 无 天 进程 之 间 要 使 用 共享 存储 段 ， 那 么 有 两 种 蔡 代 的 方 
法 。 一 种 是 应 用 程序 使 用 XSI 共 宇 存 储 函 数 ， 另 一 种 是 使 用 mmap 将 同 
一 文件 映射 至 它们 的 地 址 空间 ， 为 此 使 用 MAP_SHARED 标 志 。 


15.10 POSIX 量 


POSIX 信 号 量 机 制 是 3 种 IPC 机 制 之 一 ，3 种 IPC 机 制 产 于 POSIX.1 的 
实时 扩展 。Single UNIX Specification 将 3 种 机 制 《消息 队列 、 信 和 号 量 和 
共享 存储 ) 置 于 可 选 部 分 中 。 在 SUSv4 之 前 ，POSIX 信 和 号 量 接口 已 经 被 
包含 在 信号 量 选 项 中 。 在 SUSv4 中 ， 这 些 接口 被 移 至 了 基本 规范 ， 而 消 
妃 队 列 和 共享 存储 接口 依然 是 可 选 的 。 

POSIX 信 和 号 量 接口 意 在 解决 XSI 信 和 号 量 接口 的 几 个 缺陷 。 

。 相 比 于 XSI 接 口 ，POSIX 信 和 号 量 接口 考虑 到 了 更 高 性 能 的 实现 。 

POSIX 信号 量 接口 使 用 更 简单 : 没有 信号 量 集 ， 在 熟悉 的 文件 系 
统 操作 后 一 些 接口 被 模式 化 了 。 尽 管 没 有 要 求 一 定 要 在 文件 系统 中 实 
现 ， 但 是 一 些 系统 的 确 是 这 么 实现 的 。 


*POSIX 信 和 号 量 在 删除 时 表现 更 完美 。 回 忆 一 下 ， 当 一 个 XSI 信 和 号 量 
被 删除 时 ， 使 用 这 个 信号 量 标识 符 的 操作 会 失败 ， 并 将 errmo 设 置 成 
EIDRM。 使 用 POSIX 信 号 量 时 ， 操 作 能 继续 正常 工作 直到 该 信号 量 的 
最 后 一 次 引用 被 释放 。 

POSIX 信 号 量 有 两 种 形式 : 命名 的 和 未 命名 的 。 它 们 的 差异 在 于 
创建 和 销毁 的 形式 上 ， 但 其 他 工作 一 样 。 未 命名 信号 量 只 存在 于 内 存 
中 ， 并 要 求 能 使 用 信号 量 的 进程 必须 可 以 访问 内 存 。 这 意味 着 它们 只 
能 应 用 在 同一 进程 中 的 线程 ， 或 者 不 同 进程 中 已 经 映射 相同 内 存 内 容 
到 它们 的 地 址 空间 中 的 线程 。 相 反 ， 命 名 信和 号 量 可 以 通过 名 字 访 问 ， 
因此 可 以 被 任何 已 知 它们 名 字 的 进程 中 的 线程 使 用 。 

我 们 可 以 调用 sem_open 函 数 来 创建 一 个 新 的 命名 信和 号 量 或 者 使 用 
一 个 现 有 信号 量 。 


#include <semaphore.h> 


sem t *sem open(const char *name, int oflag, ... /* mode t mode, 
unsigned int value */ ); 
返回 值 : 者 成 功 ， 返 回 指 同 信 号 量 的 指针 ; 者 出 错 ， 返 回 
SEM. FAILED 
当 使 用 一 个 现 有 的 命名 信和 号 量 时 ， 我 们 仅仅 指定 两 个 参数 : 信和 号 
量 的 名 字 和 oflag 参数 的 0 值 。 当 这 个 oflag 人 参数 有 O_CREAT 标 志 集 时 ， 
如 果 命 名 信号 量 不 存在 ， 则 创建 一 个 新 的 。 如 果 它 已 经 存在 ， 则 会 被 
使 用 ,但 是 不 会 有 额外 的 初始 化 发 生 。 
当 我 们 指定 O_CREAT 标 志 时 ， 需 要 提供 两 个 额外 的 参数 。mode 参 
数 指定 谁 可 以 访问 信号 量 。mode 的 取 值 和 打开 文件 的 权限 位 相同 : 用 
户 读 、 用 户 写 、 用 户 执行 、 组 读 、 组 写 、 组 执行 、 其 他 读 、 其 他 写 和 
其 他 执行 。 赋 值 给 信号 量 的 权限 可 以 被 调用 者 的 文件 创建 屏蔽 字 修 改 
( 见 4.5 节 和 4.8 节 ) 。 注 意 ， 只 有 读 和 写 访问 要 紧 ,， 但 是 当 我 们 打开 


一 个 现 有 信和 号 量 时 接口 不 允许 指定 模式 。 实 现 经 解 为 谈 和 写 打 开 信和 号 


EA 


量 。 

在 创建 信号 量 时 ，value 参 数 用 来 指定 信号 量 的 初始 值 。 它 的 取 值 
Æ0~SEM_VALUE_MAX ( 见 图 2-9) ° 

如 果 我 们 想 确 保 创 建 的 是 信号 量 ， 可 以 设置 oflag 参 数 为 
O_CREATIO_EXCL。 如 果 信 号 量 已 经 存在 ， 会 导致 sm_open 失 败 。 

为 了 增加 可 移植 性 ， 在 选择 信号 量 命名 时 必须 遵循 一 定 的 规则 e 

“名 字 的 第 一 个 字符 应 该 为 斜 枉 U) 。 尽 管 没 有 要 求 POSIX 信 和 号 量 
的 实现 要 使 用 文件 系统 ， 但 是 如 果 使 用 了 文件 系统 ， 我 们 就 要 在 名 字 
被 解释 时 消除 二 义 性 。 

“名 字 不 应 包含 其 他 斜 杠 以 此 避免 实现 定义 的 行为 。 例 如 ， 如 果 文 
件 系统 被 使 用 了 ， 那 么 名 字 /mysem 和 /mysem 会 被 认定 为 是 同一 个 文件 
名 ， 但 是 如 果实 现 没 有 使 用 文件 系统 ， 那 么 这 两 种 命名 可 以 被 认为 是 
不 同 的 〈 考 虑 下 如 果实 现 把 名 字 哈 希 运算 转换 成 一 个 用 来 识别 信和 号 量 
的 整数 值 会 发 生 什么 ) 。 

“信号 量 名 字 的 最 大 长 度 是 实现 定义 的 。 名 字 不 应 该 长 于 
_POSIX_NAME_MAX ( 见 图 2-8) 个 字符 长 度 。 因 为 这 是 使 用 文件 系 
统 的 实现 能 允许 的 最 大 名 字 长 度 的 限制 。 

如 果 想 在 信号 量 上 进行 操作 ，sem_open 函 数 会 为 我 们 返回 一 个 信 
号 量 指针 ， 用 于 传递 到 其 他 信号 量 函 数 上 。 当 完成 信号 量 操作 时 ， 可 
以 调用 sem_close 了 芳 数 来 释放 任何 信号 量 相关 的 资源 。 


#include <semaphore.h> 


int sem  close(sem t *sem); 
返回 值 : ERD, welo; Auta, we- 
如 采 进 程 没 有 首先 调用 sem_close 而 人 退出， 那么 内 核 将 目 动 关闭 任 
何 打开 的 信号 量 。 注 意 ， 这 不 会 影响 信号 量 值 的 状态 一 如 果 已 经 对 它 
进行 了 增 1 操 作 ， 这 并 不 会 仅 因 为 退出 而 改变 。 类 似 地 ， 如 果 调 用 


sem_close ， 信 号 量 值 也 不 会 受到 影响 。 在 XSI 信 号 量 中 没有 类 似 
SEM_UNDO 标 志 的 机 制 。 

Ay DAS Fdsem, unlinkEN OR FAS — “Pat 4 fei 7 3. © 

#include <semaphore.h> 

int sem_unlink(const char *name); 

返回 值 : ABD), Reo; Aoife, we- 

sem_unlink KAMRE SEWE 0E o 如果 没有 打开 的 信号 量 引 用 ， 
则 该 信号 量 会 被 销毁 。 人 否则 ， 销 毁 将 延迟 到 最 后 一 个 打开 的 引用 天 
H] ° 

AVRXSIfR SE, TR ABER — + KAHR D POSIX fa 8 
的 值 。 计数 减 1 和 对 一 个 二 进 制 信号 量 加 锁 或 者 获取 计数 信号 量 的 相关 
资源 是 相 类 似 的 。 

注意 ， 信 号 量 和 POSIX 信 号 量 之 间 是 没有 差别 的 。 是 采用 二 进 制 
言 号 量 还 是 用 计数 BBR A 化 和 使 用 信号 量 。 如 果 一 个 
信和 号 量 只 是 有 值 0 或 者 1， 那 么 它 吏 是 二 进 制 信号 量 。 当 二 进 制 信号 量 
是 1 时 ， 它 束 古 “解锁 的 "， 如 果 它 的 值 是 0， 那 就 是 “加 锁 的 ”。 

可 以 使 用 sem_wait 或 者 sem_trywait 函 数 来 实现 信号 量 的 减 1 操作 。 


#include <semaphore.h> 


int sem_trywait(sem_t *sem); 
int sem, wait(sem t *sem); 
PY TEAR: ERD, silo; 大 出 错 则 ， 返 回 -1 

使 用 sem_wait 函 数 时 ， 如 采信 号 量 计数 是 0 驶 会 发 生 阻 蹇 。 直 到 成 
功 使 信号 量 减 1 或 者 被 信号 中 断 时 才 返 回 。 可 以 使 用 sem_trywait 函 数 来 
yee BA SE o Ye] sem_trywaithY, WREE SEE, WASH, MES 
返回 -1 并 且 将 ermo 置 为 EAGAIN ° 

第 三 个 选择 是 阻塞 一 段 确定 的 时 间 。 为 此 ， 可 以 使 用 sem_timewait 


#include <semaphore.h> 

#include <time.h> 

int sem_timedwait(sem_t *restrict sem, 

const struct timespec *restrict tsptr); 
IRE: AA, RIO; EE, we- 

想 要 放弃 等 竺 信号 量 的 时 候 ， 可 以 用 tsptr 参 数 指定 绝对 时 间 。 超 时 
是 基于 CLOCK_REALTIME 时 钟 的 (回忆 图 6-8) 。 如 果 信 和 号 量 可 以 立 
即 碱 1， 那 么 超时 值 吏 不 重要 了 ， 尽 管 指 定 的 可 能 是 过 去 的 某 个 时 间 ， 
言 号 量 的 减 1 操作 依然 会 成 功 。 如 果 超 时 到 期 并 且 信 号 量 计数 没 能 减 
1, sem_timedwait 将 返回 -1 且 将 errno 设 置 为 ETIMEDOUT ° 

可 以 调用 sem_post 函 数 使 信号 量 信 增 1。 这 和 解锁 一 个 二 进 制 信和 号 
量 或 者 释放 一 个 计数 信号 量 相关 的 货源 的 过 程 是 类 似 的 。 


#include <semaphore.h> 


int sem_post(sem_t *sem); 
REE: ARJ, EO; Amis, Ael- 
调用 sem_post 时 ， 如 果 在 调用 sem_wait (或 者 sem_timedwait) 中 发 
生 进 程 阴 堵 ， 那 么 进程 会 被 唤醒 并 且 被 sem_post 增 1 的 信号 量 计数 会 再 
次 被 sm_wait (或 者 sem_timedwait) W1 ° 
当 我 们 想 在 单个 进程 中 使 用 POSIX 信 号 量 时 ， 使 用 未 命名 信号 量 
更 容易 。 这 仅仅 改变 创建 和 销毁 信和 号 量 的 方式 。 可 以 调用 sem_init 范 数 
来 创建 一 个 未 命名 的 信和 号 量 。 


#include <semaphore.h> 


int sem_init(sem_t *sem, int pshared, unsigned int value); 

返回 值 : Ak, Reo; AES, we- 
pshared 参 数 表明 是 否 在 多 个 进程 中 使 用 信号 量 。 如 果 是 ， 将 其 设 
置 成 一 个 非 0 值 。value 参 数 指 定 了 信号 量 的 初始 值 。 


需要 声明 一 个 sem_t 类 型 的 变量 并 把 它 的 地 址 传递 给 sem_init 来 实现 
初始 化 ， 而 不 是 像 sem_open 芳 数 那 样 返回 一 个 指 同 信和 号 量 的 指针 。 如 
果 要 在 两 个 进程 之 间 使 用 信和 号 量 ， 需 要 确保 sem 参 数 指向 两 个 进程 之 间 
共享 的 内 存 范 围 。 

对 未 命名 信号 量 的 使 用 已 经 完成 时 ， 可 以 调用 sem_destroy 函 数 丢 
弃 它 。 


#include <semaphore.h> 


int sem_destroy(sem_t *sem); 
返回 值 : EH, welo; Aw te, e- 
调用 sem_destroy 后 ， 不 能 再 使 用 任何 带 有 sem Wie SEL, BR 
非 通过 调用 sem_init 重 新 初始 化 它 。 
sem getvalueEX Zi n] LAH RM 8 [8 7 EB. 9 


#include <semaphore.h> 


int sem_getvalue(sem_t *restrict sem, int *restrict valp); 
返回 值 : Ab, Reo; AE, we- 

成 功 后 ，valp 指 向 的 整数 值 将 包含 信号 量 值 。 但 是 请 注意 ， 我 们 试 
图 要 使 用 我 们 刚 读 出 来 的 值 的 时 候 ， 信 号 量 的 值 可 能 已 经 变 了 。 除 非 
使 用 额外 的 同步 机 制 来 避免 这 种 竞争 ， 否 则 sem_getvalue 函 数 只 能 用 于 
调试 。 

Mac OS X 10.6.8 不 支持 sem_getvalue 芳 数 。 

实例 

介绍 POSIX 接 口 的 动机 之 一 就 是 ， 通 过 设计 ， 它 们 的 性 能 要 明显 
好 于 现 有 XSI 信 号 量 接 口 。 下 面 将 了 解 现 有 系统 是 否 达 到 了 这 个 目标 ， 
尽管 这 些 系统 没有 设计 支持 实时 的 应 用 。 

在 图 15-34 中 ， 让 3 个 进程 在 两 种 平台 (Linux 3.2.0 和 Solaris 10) 上 
竞争 分 配 和 释放 信和 号 量 1 000 000 次 ， 比 较 了 分 别 使 用 XSI 信 号 量 (不 市 
SEM_UNDO) 和 POSIX 信 号 量 时 的 性 能 。 


Solaris 10 Linux 3.2.0 


— 


[xsise —— 11.85 15.85 27.91 0.33 5.93 7.33 
POSIX (5 5 13.72 10.52 24.44 0.26 0.75 0.41 
图 15-34 信号 量 实现 的 时 间 比 较 


在 图 15-34 中 可 以 看 到 ， 在 Solaris 系 统 中 ，POSIX 信 号 量 相 对 于 XSI 
言 写 量 在 时 间 上 仪 提 高 了 12%， 但 是 在 Linux 系 统 中 却 提高 了 94% GE 
18 倍 的 速度 ) 。 如 果 跟踪 程序 ， 我 们 会 发 现 ，POSIX 信 号 量 的 Linux 实 
现 将 文件 映射 到 了 进程 地 址 空间 中 ， 并 且 没 有 使 用 系统 调用 来 操作 各 
自 的 信号 量 。 

实例 

回忆 图 12-5，Single UNIX Specification 并 没 用 定义 当 一 个 线程 对 一 
个 普通 互 斥 量 加 锁 ， 而 另 一 个 线程 试图 去 解锁 它 的 情况 ， 但 是 这 种 情 
况 下 错误 检查 互 斥 量 和 递归 互 斥 量 会 产生 错误 。 因 为 二 进 制 信号 量 昌 
以 像 互 斥 量 一 样 来 使 用 ， 我 们 可 以 使 用 信号 量 来 创建 自己 的 锁 原 语 从 
而 提供 互 斥 。 

假设 我 们 将 要 创建 自己 的 锁 ， 这 种 锁 能 被 一 个 线程 加 锁 而 被 另 一 
线程 解锁 ， 那 么 它 的 结构 可 能 是 这 样 的 : 


struct slock 1 


sem t *semp; 
char name[ POSIX NAME MAX]; 
图 15-35 中 的 程序 展示 了 基于 信号 量 的 互 不 原 语 的 实现 。 


#include "slock.h" 
#include <stdlib.h> 
#include <stdio.h> 
#include <unistd.h> 
#include <errno.h> 


Struct Slock * 
s_alloc() 
{ 
struct slock *sp; 
static dnt cont; 


if ((sp = malloc(sizeof(struct slock))) == NULL) 
return (NULL); 
do { 
snprintf(sp-»name, sizeof(sp-»name), "/%ld.%d", (long)getpid(), 
cnt++); 
sp->semp = sem_open(sp->name, O CREAT|O EXCL, S IRWXU, 1); 
) while ((sp->semp == SEM FAILED) && (errno == EEXIST)); 
if (sp->semp == SEM FAILED) { 


free (sp); 

return (NULL); 
} 
sem unlink(sp-»name); 
return(sp); 


void 
S free(struct slock *sp) 
( 
sem close(sp-»semp); 
free (sp); 


int 
S lock(struct slock *sp) 
{ 
return (Sem wait (sp->semp) ); 


int 
s_trylock(struct slock *sp) 
{ 
return (sem_trywait (sp->semp) ); 


int 
s_unlock(struct slock *sp) 
{ 


return (sem_post (sp->semp) ); 


图 15-35 使 用 POSIX 信 号 量 的 互 斥 


根据 进程 ID 和 计数 器 来 创建 和 名字。 我 们 不 会 刻意 用 互 不 量 去 保护 
计数 器 ， 因 为 当 两 个 竞争 的 线程 同时 调用 s_alloc 并 以 同一 个 名 字 结 束 
时 ， 在 调用 sem_open 中 使 用 O_EXCL 标 志 将 会 使 其 中 一 个 线程 成 功 而 
另 一 个 线程 失败 ， 失 败 的 线程 会 将 errno 设 置 成 EEXIST， 所 以 对 于 这 种 
情况 ， 我 们 只 是 再 次 尝试 。 注 意 ， 我 们 打开 一 个 信号 量 后 断 开 了 它 的 
和 连接。 这 销毁 了 名 字 ， 所 以 导致 其 他 进程 不 能 再 次 访问 它 ， 这 也 简化 
了 进程 结束 时 的 清理 工作 。 


15.11 进程 - 进程 属 ' 


下 面 详细 说 明 客 户 进 程 和 服务 器 进程 的 某 些 属性 ， 这 些 属性 受到 
它们 之 间 所 使 用 的 各 种 了 PC 类 型 的 影响 。 最 简单 的 关系 类 型 是 使 客户 进 
程 fork 然后 exec 所 希望 的 服务 器 进程 。 在 fork 之 前 驳 创 建 两 个 半 双 工 
管道 使 数据 可 在 两 个 方 同 传输 。 图 15-16 是 这 种 安排 的 一 个 例子 。 所 执 
行 的 服务 器 进程 可 能 是 一 个 设置 用 户 ID 的 程序 ， 这 使 它 具 有 了 特权 。 
另外 ， 服 务 喜 进程 查看 客户 进程 的 实际 用 户 ID 残 可 以 决定 客户 进程 的 
真实 身份 。 《回忆 8.10 入 ， 从 中 可 了 解 到 在 exec 前 后 实际 用 户 ID 和 实际 
组 ID 并 没有 改变 。) 

在 这 种 安排 下 ， 可 以 构建 一 个 open 服 务 器 进程 (open server) 

(417.5 节 提供 了 这 种 客户 进程 -服务 器 进程 机 制 的 一 种 实现 。) 它 为 客 
户 进程 打开 文件 而 不 是 客户 进程 目 己 调用 open 函数 。 这 样 葡 可 以 在 正 
第 的 UNIX 用 户 权 限 、 组 权限 以 及 其 他 权限 之 上 或 之 外 ， 增 加 附加 的 权 
限 检 查 。 假 定 服务 器 进程 执行 的 是 设置 用 户 ID 程序 ， 这 给 予 了 它 附 加 
的 权限 (很 可 能 是 root 权 限 ) 。 服 务 器 进程 用 客户 进程 的 实际 用 户 ID 


来 决定 是 否 给 予 它 对 所 请 求 文件 的 访问 权限 。 使 用 这 种 方式 ， 可 以 构 
建 一 个 服务 器 进程 ， 它 允许 某 些 用 户 获 得 通常 没有 的 访问 权限 。 

在 此 例子 中 ， 因 为 服务 器 进程 是 父 进程 的 子 进 程 ， 所 以 它 所 能 做 
的 就 是 将 文件 内 容 传送 给 父 进程 。 尽 管 这 种 方式 对 普通 文件 工作 得 很 
好 ,但 是 对 有 些 文件 却 不 能 工作 ， 如 特殊 设备 文件 。 我 们 希望 能 做 的 
是 使 服务 器 进程 打开 所 要 求 的 文件 ， 并 传 回 文件 描述 符 。 但 是 实际 情 
况 却 是 父 进程 可 辣子 进程 传送 打开 文件 描述 符 ， 而 子 进程 却 不 能 癌 父 
进程 传 回 文件 描述 符 (除非 使 用 专门 的 编程 技术 ， 这 将 在 第 17 章 介 
绍 ) 。 

图 15-23 中 展示 了 男 一 种 类 型 的 服务 器 进程 。 这 种 服务 器 进程 是 一 
个 守护 进程 ， 所 有 客户 进程 用 某 种 形式 的 IPC 与 其 联系 。 对 于 这 种 形 
式 的 客户 进程 -服务 器 进程 关系 ， 不 能 使 用 管道 。 需 要 使 用 一 种 形式 的 
命名 IPC， 如 FIFO 或 消息 队列 。 使 用 FIFO 时 ， 如 有 果 服 务 器 进程 必需 将 
数据 送 回 客户 进程 ， 则 对 每 个 客户 进程 都 要 有 单独 使 用 的 FIFO。 如 果 
客户 进程 -服务 器 进程 应 用 程序 只 有 客户 进程 向 服务 器 进程 发 送 数 据 ， 
则 只 需要 一 个 众所周知 的 FIFO。 (System V 行 式 打印 机 假 脱 机 程序 使 
用 这 种 形式 的 客户 进程 -服务 器 进程 。 客 户 进程 是 Ip(1) 命 令 ， 服 务 器 进 
程 是 psched 和 守护 进程 。 因 为 只 有 从 客户 进程 到 服务 器 进程 的 数据 流 ， 
所 有 只 需 使 用 一 个 FIFO。 没 有 需要 送 回 客户 进程 的 数据 。) 

使 用 消息 队列 则 存在 多 种 可 能 性 。 

(1) 在 服务 器 进程 和 所 有 客户 进程 之 间 只 使 用 一 个 队列 ， 使 用 每 
个 消息 的 类 型 字段 指明 谁 是 消息 的 接受 者 。 例 如 ， 窗 户 进程 可 以 用 设 
置 为 1 的 类 型 字段 来 发 送 它们 的 消息 。 在 请 求 之 中 应 包括 客户 进程 的 进 
程 ID。 此 后 ， 服 务 器 进程 在 发 送 响 应 消息 时 ， 将 类 型 字段 设置 为 客户 
进程 的 进程 ID。 服 务 器 进程 只 接受 类 型 字段 为 1 的 消息 (msgrcv 的 第 4 
个 参数 ) ， 客 户 进程 则 只 接受 类 型 字段 等 于 它们 进程 ID 的 消息 。 


(2) 另 一 种 方法 是 每 个 客户 进程 使 用 一 个 单独 的 消息 队列 。 在 向 
服务 器 进程 发 送 第 一 个 请 求 之 前 ， 每 个 客户 进程 先 使 用 键 
IPC_PRIVATE 创 建 它 自己 的 消息 队列 。 服 务 器 进程 也 有 它 自 己 的 队 
列 ， 其 键 或 标识 符 是 所 有 客户 进程 都 知道 的 。 客 户 进 程 将 其 第 一 个 请 
求 发 送 到 服务 器 进程 的 众所周知 的 队列 上 ， 该 请 求 中 应 包含 其 客户 进 
程 消息 队列 的 队列 ID。 服 务 器 进程 将 其 第 一 个 响应 发 送 到 此 客户 进程 
队列 ， 此 后 的 所 有 请 求 和 响应 都 在 此 队列 上 交换 。 

使 用 消息 队列 的 这 两 种 技术 都 可 以 用 共享 内 存 段 和 同步 方法 〈 信 
号 量 或 记录 锁 ) 来 实现 。 

使 用 这 种 类 型 的 客户 进程 -服务 器 进程 关系 (客户 进程 和 服务 器 进 
程 是 无 关 进 程 ) 的 问题 是 服务 器 进程 如 何 准 确 地 标识 客户 进程 。 除 非 
服务 器 进程 正在 执行 一 种 非特 权 操 作 ， 否 则 服务 器 进程 知道 客户 进程 
的 身份 是 很 重要 的 。 例 如 ， 若 服务 器 进程 是 一 个 设置 用 户 ID F, w 
有 这 种 要 求 。 虽 然 所 有 这 几 种 形式 的 IPC 都 经 由 内 核 ， 但 是 它们 并 未 提 
供 任何 设施 使 内 核能 够 标识 发 送 者 。 

对 于 消息 队列 ， 如 果 在 客户 进程 和 服务 器 进程 之 间 使 用 一 个 专用 
队列 (于 是 一 次 只 有 一 个 消息 在 该 队列 上 ) ， 那 么 队列 的 msg Ispid 包 
含 了 对 方 进程 的 进程 ID。 但 是 当 客 户 进程 将 请 求 发 送 给 服务 器 进程 
时 ， 我 们 想 要 的 是 客户 进程 的 有 效用 户 ID， 而 不 是 它 的 进程 ID。 现 在 
还 没有 一 种 可 移植 的 方法 ， 在 已 知 进程 D 情 况 下 可 以 得 到 有 效用 户 
ID。 (自然 地 ， 内 核 在 进程 表 项 中 保持 有 这 两 种 值 ， 但 是 除非 彻底 检 
查 内 核 存 储 空 间 ， 否 则 已 知 一 个 ， 无 法 得 到 另 一 个 。) 

我 们 将 在 17.2 节 中 使 用 下 列 技术 ， 使 服务 器 进程 可 以 标识 客户 进 
程 。 这 一 技术 可 使 用 FIFO、 消 息 队 列 、 信 和 号 量 以 及 共享 存储 。 在 下 面 
的 说 明 中 假定 按 图 15-23 使 用 了 FIFO。 客 户 进 程 必须 创建 它 自己 的 
FIFO， 并 且 设 置 该 FIFO 的 文件 访问 权限 ， 使 得 只 允许 用 户 读 和 用 户 
写 。 假 定 服务 器 进程 具有 超级 用 户 特权 (或 者 它 很 可 能 并 不 关心 客户 


进程 的 真实 标识 ) ， 那 么 服务 器 进程 仍 可 读 、 写 此 FIFO。 当 服务 器 进 
程 在 众所周知 的 FIFO 上 接收 到 客户 进程 的 第 一 个 请 求 时 ( 它 应 当 包 含 
客户 进程 专用 FIFO 的 标识 ) ， 服 务 器 进程 调用 针对 客户 进程 专用 FIFO 
的 stat 或 fstat。 服 务 絮 进程 假设 .客户 进程 的 有 效用 户 ID 是 FIFO 的 所 有 
者 《stat 结构 的 st_uid 字 段 ) 。 服 务 器 进程 验证 该 FIFO 只 有 用 户 读 和 用 
户 写 权限 。 服 务 器 进程 还 应 检查 与 该 FIFO 有 关 的 3 个 时 间 量 (stat 结 
构 的 st_atime、st_mtime 和 st_ctime 字 段 ) ， 要 检查 它们 与 当前 时 间 是 和 否 
很 接近 (如 不 早 于 当前 时 间 15 秒 或 30 秒 ) 。 如 果 一 个 恶意 客户 进程 可 
以 创建 一 个 FIFO， 使 男 一 个 用 户 成 为 其 所 有 者 ， 并 且 设 置 该 文件 的 权 
限 位 为 用 户 读 和 用 户 写 ， 那 么 在 系统 中 就 存在 了 其 他 基础 性 的 安全 间 
题 o 

为 了 用 XSI IPC 实 现 这 种 技术 ， 回 想 一 下 与 每 个 消息 队列 、 信 和 号 量 
以 及 共享 存储 段 相关 的 ipc_perm 结 构 ， 它 标识 了 IPC 结 构 的 创建 者 
(cuid 和 cgid 字 段 )。 和 使 用 FIFO 的 实例 一 样 ， 服 务 器 进程 应 当 要 求 客 
户 进程 创建 该 IPC 结 构 ， 并 使 客户 进程 将 访问 权 设 置 为 只 允许 用 户 读 和 
用 户 写 。 服 务 器 进程 也 应 检验 与 该 IPC 相 关 的 时 间 值 与 当前 时 间 是 否 很 
接近 (因为 这 些 IPC 结 构 在 显 式 地 删除 之 前 一 直 存 在 ) 。 

在 17.3 广 中， 将 会 看 到 进行 这 种 身份 验证 的 一 种 更 好 的 方法 ， 束 是 
内 核 提 供 客 户 进 程 的 有 效用 户 ID 和 有 效 组 ID。 套 接 字 子 系 统 在 两 个 进 
程 之 间 传 送 文件 描述 符 时 可 以 做 到 这 一 点 。 


15.12 小 结 


本 章 详 细 说 明了 进程 间 通 信 的 多 种 形式 : 管道 、 命 名 管道 
(FIFO) 、 通 常 称 为 XSI IPC 的 3 种 形式 的 IPC (消息 队列 、 信 号 量 和 
共享 存储 ) ， 以 及 POSIX 提 供 的 蔡 代 信号 量 机 制 。 信 号 量 实 际 上 是 同 


步 原 语 而 不 是 IPC, FAUT SRS BTR 〈 如 共享 存储 段 ) 的 同步 访问 。 对 
于 管道 ， 我 们 说 明了 popen 函 数 的 实现 、 协 同 进程 以 及 使 用 标准 IO 库 缓 
冲 机 制 时 可 能 过 到 的 问题 。 

经 过 分 别 对 消息 队列 与 全 双 工 管道 的 时 间 以 及 信和 号 量 与 记录 锁 的 
时 间 进 行 比较 ， 提 出 了 下 列 建议 ， 要 学 会 使 用 管道 和 FIFO， 因 为 这 两 
种 基本 技术 仍 可 有 效 地 应 用 于 大 量 的 应 用 程序 。 在 新 的 应 用 程序 中 ， 
要 尽 可 能 避免 使 用 消 轧 队列 以 及 信号 量 ， 而 应 当 考 虑 全 双 工 管道 和 记 
杂 锁 ， 它 们 使 用 起 来 会 简单 得 多 。 共 至 存储 仍然 有 它 的 用 途 ， 虽 然 通 
过 mmap 函 数 (714.855) 也 能 提供 同样 的 功能 。 

下 一 章 将 介绍 网 络 IPC， 它 们 使 进程 能 够 跨越 计算 机 的 边界 进行 通 
信 。 


习题 


15.1 在 图 15-6 的 程序 中 ， 在 父 进 程 代码 的 末尾 删除 waitpid 前 的 
close, ZEE ARI 

15.2 在 图 15-6 的 程序 中 ， 在 父 进程 代码 的 末尾 删除 waitpid， 结 果 将 
如 何 ? 

15.3 WAR popen 函数 的 参数 是 一 个 不 存在 的 命令 ， 会 造成 什么 结 
果 ? 编写 一 段 小 程序 对 此 进行 测试 。 

15.4 在 图 15-18 的 程序 中 ， 删 除 信号 处 理 程序 ， 执 行 该 程序 ， 然 后 
终止 子 进程 。 和 输入 一 行 输入 后 ， 怎 样 才能 说 明 父 进程 是 由 SIGPIPE 终 止 
的 ? 

15.5 在 图 15-18 的 程序 中 ， 用 标准 MO 库 代 替 进 行 管道 读 、 写 的 read 
和 write ° 


15.6 POSIX.1 加 入 waitpid 函 数 的 理由 之 一 是 ，POSIX.1 之 前 的 大 多 
数 系统 不 能 处 理 下 面 的 代码 。 
if ( (fp = popen("/bin/true", "r")) == NULL ) 


if ( (rc = system("sleep 100")) == -1) 
if (pclose(fp) == -1) 


若 在 这 段 代码 中 不 使 用 waitpid 函 数 会 如 何 ?” 用 wait 代 替 呢 ? 

15.7 当 一 个 管道 被 写 者 天 财 后 ， 解 释 select 和 poll 是 如 何 处 理 该 管 
道 的 输入 描述 符 的 。 为 了 确定 答案 是 否 正 确 ， 编 两 个 小 测试 程序 ， 一 
个 用 select， 另 一 个 用 poll 。 

当 一 个 管道 的 读 端 被 关闭 时 ， 请 重 做 此 习题 以 查看 该 管道 的 输出 
描述 符 。 

15.8 如 果 popen 以 type 为 "r" 执 行 cmdstring， 并 将 结果 写 到 标准 错误 
输出 ， 结 有 果 会 如 何 ? 

15.9 既然 popen 函数 能 使 shell 执 行 它 的 cmdstring 参 数 ， 那 入 
cmdstring 终 止 时 会 产生 什么 结果 ? feos: 画 出 与 此 相关 的 所 有 进 
程 。) 

15.10 POSIX.1 特 别 声 明 没 有 定义 为 读 写 而 打开 FIFO。 虽 然 大 多 数 
UNIX 系 统 允 许 读 写 FIFO， 但 是 请 用 非 阻塞 方法 实现 为 读 写 而 打开 
FIFO ? 

15.11 除非 文件 包含 敏感 数据 或 机 密 数 据 ， 否 则 允许 其 他 用 户 读 文 
件 不 会 造成 损害 。 但 是 ， 如 果 一 个 恶意 进程 读 取 了 被 一 个 服务 器 进程 
和 几 个 客户 进程 使 用 的 消息 队列 中 的 一 条 消息 后 ， 会 产生 什么 后 果 ? 
恶意 进程 需要 知道 哪些 信息 就 可 以 读 消 息 队 列 ? 


15.12 编写 一 段 程序 完成 下 面 的 工作 。 执 行 一 个 循环 5 次 ， 在 每 次 
循环 中 ， 创 建 一 个 消息 队列 ， 打 印 该 队列 的 标识 符 ， 然 后 删除 队列 。 
接着 再 循环 5 次 ， 在 每 次 循环 中 利用 键 IPC_PRIVATE 创 建 消息 队列 ， 并 
将 一 条 消息 放 在 队列 中 。 程 序 终止 后 用 ipcs(1) 查 看 消息 队列 。 解 释 队 
列 标识 符 的 变化 。 

15.13 描述 如 何在 共享 存储 段 中 建立 一 个 数据 对 象 的 链接 列表 。 列 
表 指 针 如 何 存 储 ? 

15.14 画 出 图 15-33 中 的 程序 运行 时 下 列 值 随时 间 变 化 的 曲线 图 : 
父 进程 和 子 进程 中 的 变量 i、 共 享 存储 区 中 的 长 整 型 值 以 及 update 范 数 
的 返回 值 。 假 设 子 进程 在 fork 后 先 运行 。 

15.15 使 用 15.9 节 中 的 XSI 共 享 存 储 画 数 代替 共享 存储 映射 区 ， 改 写 
图 15-33 中 的 程序 。 

15.16 使 用 15.8 节 中 的 XSI 信 号 量 函 数 改 写 图 15-33 中 的 程序 ， 实 现 
父 进 程 与 子 进程 间 的 交替 。 

15.17 使 用 建议 性 记录 锁 改写 图 15-33 中 的 程序 ， 实 现 父 进程 与 子 进 
程 间 的 交替 。 

15.18 使 用 15.10 方 中 的 POSIX 信 和 号 量 画 数 改 写 图 15-33 中 的 程序 ， 
实现 父 进程 与 子 进 程 间 的 交替 。 


16 SIPC: 


16.1 引言 


上 一 章 我 们 考察 了 各 种 UNIX 系 统 所 提供 的 经 典 进程 间 通 信 机 制 
(IPC) : 管道 、FIFO、 消 息 队 列 、 信 号 量 以 及 共享 存储 。 这 些 机 制 允 
许 在 同一 台 计 算 机 上 运行 的 进程 可 以 相互 通信 。 本 章 将 考察 不 同 计算 
机 (通过 网 络 相 连 ) 上 的 进程 相互 通信 的 机 制 : 网 络 进 程 间 通信 
(network IPC) » 
在 本 章 中 ， 我 们 将 描述 套 接 字 网 络 进 程 间 通 信 接 口 ， 进 程 用 该 接 
口 能 够 和 其 他 进程 通信 ， 无 论 它们 是 在 同一 台 计 算 机 上 还 是 在 不 同 的 
计算 机 上 “。 实 际 上 ， 这 正 是 套 接 字 接 口 的 设计 目标 之 一 : 同样 的 接口 
婚 可 以 用 于 计算 机 间 通 信 ， 也 可 以 用 于 计算 机 内 通信 。 尽 管 套 接 字 接 
口 可 以 采用 许多 不 同 的 网 络 协议 进行 通信 ， 但 本 章 的 讨论 限制 在 因 特 
网 事实 上 的 通信 标准 : TCP/IP 协 议 栈 。 
POSIX.1 中 指定 的 套 接 字 API 是 基于 4.4 BSD 套 接 字 接口 的 。 尽 管 这 
些 年 套 接 字 接 口 有 些 细微 的 变化 ， 但 是 当前 的 套 接 字 接 口 与 20 世纪 80 
年 代 早 期 4.2BSD 所 引入 的 接口 很 类 似 。 
本 章 仅 是 一 个 套 接 字 API 的 概述 。Stevens、Fenner 和 Rudoff[2004] 
在 有 关 UNIX 系 统 网 络 编程 的 权威 性 文献 中 详细 讨论 了 套 接 字 接口 。 


16.2 yii 


和 套 接 字 是 通信 器 点 的 抽象 。 正 如 使 用 文件 摘 述 符 访 问 文 件 ， 应 用 
程序 用 套 接 字 描 述 符 访问 套 接 字 。 套 接 字 描述 符 在 UNIX 系 统 中 被 当 作 
征 一 种 文件 换 述 符 。 事 实 上 ， 许 多 处 理 文件 摘 述 符 的 函数 (如 read 和 
write) 可 以 用 于 处 理 套 接 字 描述 符 。 

为 创建 一 个 套 接 字 ， 调 用 socket 函 数 。 


#include <sys/socket.h> 


int socket (int domain, int type, int protocol); 
返回 值 : ERD, REE BRF) 描述 符 ; ate, e- 

参数 domain 〈 域 ) 确定 通信 的 特性 ， 包 括 地 址 格式 (E B— BYE 
细 摘 述 )。 图 16-1 总 结 了 由 POSIX.1 指 定 的 各 个 域 。 各 个 域 都 有 目 己 表示 
地 址 的 格式 ， 而 表示 各 个 域 的 常数 都 以 AF_ 开 头 ， 意 指 地 址 族 (address 
family) 

我 们 将 在 17.2 节 讨论 UNIX 域 。 大 多 数 系统 还 定义 了 AF_LOCAL 
域 ,这 是 AF_UNIX 的 别名 。AF_UNSPEC 域 可 以 代表 “任何 ” 域 。 历 史 
上 ， 有 些 平台 文 持 其 他 网 络 协议 ， 如 AF_IPX 域 代表 的 NetWare 协 议 
族 ， 但 这 些 协议 的 域 钊 数 没 有 被 POSIX.1 标 准 定 义 。 


AF INET IPv4 因特网 域 


AF INET6 IPv6 因特网 域 
AF UNIX UNIX 域 
AF UPSPEC 未 指定 


图 16-1 套 接 字 通信 域 


23XXtypelfi/E Vr BJ, VE ARE UE 16-2028 
由 POSIX.1 定 义 的 套 接 字 类 型 ， 但 在 实现 中 可 以 自由 增加 其 他 类 型 的 文 


He 


SOCK DGRAM 固定 长 度 的、 无 连接 的 、 不 可 靠 的 报 文 传递 


SOCK RAW IP 协议 的 数据 报 接口 〈 在 POSIX.1 中 为 可 选 ) 
SOCK SEQPACKET 固定 长 度 的 、 有 序 的 、 可 靠 的 、 面 向 连接 的 报 文 传递 
SOCK STREAM 有 序 的 、 可 靠 的 、 双 向 的 、 面 向 连接 的 字 节 流 


图 16-2 套 接 字 类 型 

参数 protocol 通 常 是 0， 表 示 为 给 定 的 域 和 套 接 字 类 型 选择 默认 协 
议 。 当 对 同一 域 和 套 接 字 类 型 文 持 多 个 协议 时 ， 可 以 使 用 protocol 选择 
一 个 特定 协议 。 在 AF_INET 通信 域 中 ， 套 接 字 类 型 SOCK_STREAM 的 
默认 协议 是 传输 控制 协议 (Transmission Control Protocol, TCP) 。 在 
AF_INET 通 信 域 中 ， 套 接 字 类 型 SOCK_DGRAM 的 默认 协议 是 UDP。 
图 16-3 列 出 了 为 因特网 域 套 接 字 定义 的 协议 。 


IPPROTO IP IPv4 网 际 协 议 
IPPROTO IPV6 IPv6 网 际 协 议 (在 POSX.1 中 为 可 选 ) 


IPPROTO_ICMP 因特网 控制 报 文 协议 CInternet Control Message Protocol) 
IPPROTO RAW Jit IP 数据 包 协 议 (在 POSX.1 中 为 可 选 ) 
IPPROTO_TCP 传输 控制 协议 

IPPROTO_UDP 用 户 数据 报 协 议 〈User Datagram Protocol) 


图 16-3 为 因特网 域 套 接 字 定 义 的 协议 


对 于 数据 报 (SOCK DGRAM) 接口 ， 两 个 对 等 进程 之 间 通 信 时 
不 需要 逻辑 连接 。 只 需要 向 对 等 进程 所 使 用 的 套 接 字 送 出 一 个 报 文 。 


因此 数据 报 提供 了 一 个 无 连接 的 服务 。 另 一 方面 ， 字 市 流 
(SOCK STREAM) 要 求 在 交换 数据 之 前 ， 在 本 地 套 接 字 和 通信 的 对 
等 进程 的 套 接 字 之 间 建 立 一 个 逻辑 连接 。 

数据 报 是 自 包 含 报 文 。 发 送 数 据 报 近似 于 给 某 人 邮寄 信件 。 你 能 
邮寄 很 多 信 ， 但 你 不 能 保证 传递 的 次 序 ， 并 且 可 能 有 些 信件 会 丢失 在 
路 上 。 每 封 信件 包含 接收 者 地 址 ， 使 这 封 信件 独立 于 所 有 其 他 信件 。 
每 封 信件 可 能 送 达 不 同 的 接收 者 。 

相反 ， 使 用 面向 连接 的 协议 通信 就 像 与 对 方 打 电话 。 首 和 完 ， 需 要 
通过 电话 建立 一 个 连接 ， 连 接 建立 好 之 后 ， 彼 此 能 双向 地 通信 。 每 个 
连接 是 端 到 端的 通信 和 链 路 。 对 话 中 不 包含 地 址 信息 ， 就 像 呼叫 两 端 存 
在 一 个 点 对 点 虚拟 连接 ， 并 且 连 接 本 身上 暗示 特定 的 源 和 目的 地 。 

SOCK STREAM 套 接 字 提 供 字 市 流 服务 ， 所 以 应 用 程序 分 辨 不 出 
报 文 的 界限 。 这 意味 着 从 SOCK_STREAM 套 接 字 读 数据 时 ， 它 也 许 不 
会 返回 所 有 由 发 送 进 程 所 写 的 字 市 数 。 最 终 可 以 获得 发 送 过 来 的 所 有 
数据 ， 但 也 许 要 通过 若干 次 函数 调用 才能 得 到 。 

SOCK_SEQPACKET 套 接 字 和 SOCK STREAM 套 接 字 很 类 似 ， 只 
是 从 该 套 接 字 得 到 的 是 基于 报 文 的 服务 而 不 是 字 市 流 服务 。 这 意味 着 
从 SOCK_SEQPACKET 套 接 字 接收 的 数据 量 与 对 方 所 发 送 的 一 致 。 流 控 
制 传输 协议 (Stream Control Transmission Protocol, SCTP) 提供 了 因 特 
网 域 上 的 顺序 数据 包 服务 。 

SOCK RAW 套 接 字 提 供 一 个 数据 报 接口 ， 用 于 直接 访问 下 面 的 网 
络 层 ( 即 因特网 域 中 的 IP) 。 使 用 这 个 接口 时 ， 应 用 程序 负责 构造 
自己 的 协议 头 部 ， 这 是 因为 传输 协议 (如 TCP 和 UDP) 被 绕 过 了 。 当 创 
建 一 个 原始 套 接 字 时 ， 需 要 有 超级 用 户 特 权 ， 这 样 可 以 防止 恶意 应 用 
程序 绕 过 内 建安 全 机 制 来 创建 报 文 。 

调用 socket 与 调用 open 相 类 似 。 在 两 种 情况 下 ， 均 可 获得 用 于 IO 的 
文件 描述 符 。 当 不 再 需要 该 文件 措 述 符 时 ， 调 用 close 来 关闭 对 文件 或 


套 接 字 的 访问 ， 并 且 释 放 该 描述 符 以 便 重 新 使 用 。 

里 然 套 接 字 描述 符 本 质 上 是 一 个 文件 描述 符 ， 但 不 是 所 有 参数 为 
文件 描述 符 的 函数 都 可 以 接受 套 接 字 描述 符 。 图 16-4 总 结 了 到 目前 为 目 
所 讨论 的 大 多 数 以 文件 描述 符 为 参数 的 函数 使 用 套 接 字 描 述 符 时 的 行 
为 。 未 指定 和 由 实现 定义 的 行为 通常 意味 着 该 画 数 对 套 接 字 描 述 符 无 
效 。 例 如 ， lseek 不 能 以 套 接 字 描述 符 为 参数 ， 因 为 套 接 字 不 支持 文件 
偏 移 量 的 概念 。 


使 用 套 接 字 时 的 行为 


close (13.51) 释放 套 接 字 

Dup 和 dup2( 见 3.12 节 ) 和 一 般 文件 描述 符 一 样 复制 

fchdir (J 423 节 ) 失败 ， 并 且 将 errno KHA ENOTDIR 

fchomod( 见 4.9 47) 未 指定 

fchown (W 4.11 节 ) 由 实现 定义 

fcntl ( 见 3.14 节 ) 支持 一 些 命令 , Hf F DUPFD.F DUPFD CLOEXEC, F GETFD. 
 GETFL. F GETOWN. F SETFD. F SETFL fil F_SETOWN 
Fdatasync fll fsync (93.13 节 ) 由 实现 定义 

fstat (7,42 4f) 支持 一 些 stat 结构 成 员 ， 但 如 何 支持 由 实现 定义 
ftruncate ( 见 4.13 节 ) 未 指定 

ioctl (743.15 45) 支持 部 分 命令 ， 依 赖 于 底层 设备 驱动 

lseek ( 见 3.6 节 ) 由 实现 定义 〈 通 常 失 败 时 会 将 errno WH ESPIPE) 

mmap (AL 14.8 节 ) 未 指定 

poll (Jl 14.4.2 节 ) 正常 工作 

Pread 和 pwrite〔 见 3.11 节 ) 失败 时 会 将 errno 设 为 ESPIPE 

read ( 见 3.7 节 ) 和 readv( 见 14.6 节 ) 与 没有 任何 标志 位 的 recy CI 16.5 节 ) 等 价 

select (Wl 14.4.1 节 ) 正常 工作 
write ( 见 3.8 节 ) 和 writev ( 见 14.6 节 ) 与 没有 任何 标志 位 的 send ( 见 16.5 节 ) 等 价 


图 16-4 文件 描述 符 画 数 使 用 套 接 字 时 的 行为 
套 接 字 通 信和 是 双向 的 。 可 以 采用 shutdown 函 数 来 禁止 一 个 套 接 字 
的 IO。 


#include <sys/socket.h> 


int shutdown (int sockfd, int how); 


返回 值 : ERD, RIO; AE, we- 


如 果 how 是 SHUT_RD (关闭 读 端 ) ， 那 么 无 法 从 套 接 字 读 取 数 
据 。 如 果 how 是 SHUT_WR (KAS ia) ， 那 么 无 法 使 用 套 接 字 发 送 数 
据 。 如 果 how 是 SHUT_RDWR， 则 既 无 法 读 取 数据 ， 义 无 法 发 送 数 据 。 

能 够 关闭 (close) 一 个 套 接 字 ， 为 何 还 使 用 shutdown 呢 ?这 里 有 
香干 理由 。 首 先 ， 只 有 最 后 一 个 活动 引用 关闭 时 ，close 才 释放 网 络 端 
点 。 这 意味 着 如 果 复 制 一 个 套 接 字 〈 如 采用 dup) ， 要 直到 关闭 了 最 后 
一 个 引用 它 的 文件 描述 符 才 会 释放 这 个 套 接 字 。 而 shutdown 允许 使 一 
个 套 接 字 处 于 不 活动 状态 ， 和 引用 它 的 文件 描述 符 数 目 无 关 。 其 次 ， 
有 时 可 以 很 方便 地 关闭 套 接 字 双 向 传输 中 的 一 个 方向 。 例 如 ， 如 有 果 想 
让 所 通信 的 进程 能 够 确定 数据 传输 何 时 结束 ， 可 以 关闭 该 套 接 字 的 写 
端 ， 然 而 通过 该 套 接 字 读 端 仍 可 以 继续 接收 数据 。 


16.3 = ht 


上 一 节 学 习 了 如 何 创建 和 销毁 一 个 套 接 字 。 在 学 习 用 套 接 字 做 一 
些 有 意义 的 事情 之 前 ， 需 要 知道 如 何 标识 一 个 目标 通信 进程 。 进 程 标 
识 由 两 部 分 组 成 。 一 部 分 是 计算 机 的 网 络 地 址 ， 它 可 以 帮助 标识 网 络 
上 我 们 想 与 之 通信 的 计算 机 ; 田 一 部 分 是 该 计算 机 上 用 端口 号 表示 的 
服务 ， 它 可 以 帮助 标识 特定 的 进程 。 


16.3.1 字 节 序 


与 同一 台 计 算 机 上 的 进程 进行 通信 时 ， 一 般 不 用 考虑 字 节 序 。 字 
方 序 是 一 个 处 理 器 架构 特性 ， 用 于 指示 像 整 数 这 样 的 大 数据 类 型 内 部 
的 字 节 如 何 排序 。 图 16-5 显 示 了 一 个 32 位 整数 中 的 字 节 是 如 何 排序 的 。 


n -n+1-n+2-n+3 


n+3-n+2-n+1- n 


MSB LSB 
图 16-5 一 个 32 位 整数 的 字 节 序 
如 果 处 理 器 架构 支持 大 端 (big-endian) FHF, MARAT Ht 

址 出 现在 最 低 有 效 字 节 (Least Significant Byte, LSB) 上 。 小 端 

(little-endian) 字 节 序 则 相反 : 最 低 有 效 字 节 包 含 最 小 字 节 地 址 。 注 
ER. NEF PUY. Bem XU (Most Significant Byte, 
MSB) 总 是 在 左边 ， 最 低 有 效 字 节 总 是 在 右边 。 因 此 ， 如 果 想 给 一 个 
32 位 整数 赋值 0x04030201， 不 管 字 市 序 如 何 ， 最 高 有 效 字 节 都 将 包 合 
4， 最 低 有 效 字 节 都 将 包含 1。 如 果 接 下 来 想 将 一 个 字符 指针 (cp) 强 
制 转换 到 这 个 整数 地 址 ， 束 会 看 到 字 市 序 带 来 的 不 同 。 在 小 端 字 节 序 
的 处 理 器 上 ，cp[0] 指 癌 最 低 有 效 字 广 因 而 包含 1，cp[3] 指 问 最 高 有 效 字 
节 因 而 包含 4。 相 比较 而 言 ， 在 大 端 字 节 序 的 处 理 器 上 ，cp[0] 指 向 最 高 
有 效 字 节 因而 包含 4，cp[3] 指 向 最 低 有 效 字 市 因而 包含 1°。 图 16-6 总 结 
了 本 文 所 讨论 的 4 种 平台 的 字 节 序 。 


操作 系统 处 理 器 架构 


FreeBSD 8.0 Intel Pentium 


Linux 3.2.0 Intel Core 15 
Mac OS X 10.6.8 Intel Core 2 Duo 
Solaris 10 Sun SPARC 


图 16-6 测试 平台 的 字 节 序 
有 些 处 理 右 可 以 配置 成 大 端 ， 也 可 以 配置 成 小 山 ， 因 而 使 问题 变 
得 更 让 人 困惑 。 
网 络 协 议 指 定 了 字 节 序 ， 因 此 异 构 计 算 机 系统 能 够 交换 协议 信息 
而 不 会 被 字 节 序 所 混淆 。TCP/IP 协 议 栈 使 用 大 端 字 市 序 。 应 用 程序 交 
换 格式 化 数据 时 ， 字 节 序 问题 就 会 出 现 。 对 于 TCP/IP， 地 址 用 网 络 字 
节 序 来 表示 ， 所 以 应 用 程序 有 时 需要 在 处 理 器 的 字 节 序 与 网 络 字 蔬 序 
之 间 转 换 它 们 。 例 如 ， 以 一 种 易 读 的 形式 打印 一 个 地 址 时 ， 这 种 转换 
4R IL o 
XT TCP/IPNLHHSFEE, HAT FAR TEN SS E T HUNIPIZR TEE Z 
间 实 施 转换 的 函数 。 
#include <arpa/inet.h> 
uint32 t htonl(uint32 t hostint32); 
返回 值 : 以 网 络 字 节 序 表示 的 32 位 整数 
uint16 t htons(uint16 t hostint16); 
返回 值 : 以 网 络 字 节 序 表示 的 16 位 整数 
uint32 t ntohl(uint32 t netint32); 
返回 值 ， 以 主机 字 节 序 表示 的 32 位 整数 
uint16 t ntohs(uint16 t netint16); 


返回 值 ， 以 主机 字 市 序 表 示 的 16 位 整数 


IR" ENVIS TY, nea MAS TY e RAK” (GU) 
整数 ，s 表 示 “ 短 ”( 即 4 字 A AE EHRE ER CINE EU. HJ 
ju 


<arpa/inet.h> 头 文件 ， 但 系统 实现 经 常 是 在 其 他 头 文 件 中 声明 函数 
Hy, i i ce 对 于 系统 来 说 ， 把 这 些 


函数 实现 为 宏 也 是 很 销 见 的 。 
16.3.2 地 址 格式 


一 个 地 址 标识 一 个 特定 通信 域 的 套 接 字 端 后， 地 址 格式 与 这 个 特 
定 的 通信 域 相关 。 为 使 不 同 格式 地 址 能 够 传 入 到 套 接 字 函数 ， 地 址 会 
被 强制 转换 成 一 个 通用 的 地 址 结构 sockaddr: 
struct sockaddr 1 
sa family t sa family;  /* address family */ 


char sa data[];  /* variable-length address */ 


F 
套 接 字 实现 可 以 目 由 地 添加 额外 的 成 员 并 且 定 义 sa_data 成 员 的 大 
小 。 例 如 ， 在 Linux 中 ， 该 结构 定义 如 下 : 


struct sockaddr { 


sa_family_t sa family;  /* address family */ 

char sa data[14]; /* variable-length address */ 
H 
但 是 在 FreeBSD 中 ， 该 结构 定义 如 下 : 
struct sockaddr { 

unsigned char sa len; /* total length */ 

sa family t sa family;  /* address family */ 


char sa data[14]; /* variable-length address */ 


}; 
rej d Lk RE X. Æ <netinet/in.h> A X. fF F ° fEIPv4 因特网 域 
(AF INET) 中 ， 套 接 字 地 址 用 结构 sockaddr in 表示 : 


struct in addr { 


in addr t s addr; /* [Pv4 address */ 
fi 
struct sockaddr_in { 
sa_family_t sin family; /* address family */ 
in port t sin port; /* port number */ 
struct in addr sin addr; /* [Pv4 address */ 


Js 

数据 类 型 in_port tÆ X. p; uint16 t ° ACHE A AY in addr tŒ X AY 
uint32_t。 这 些 整数 类 型 在 <stdint.h> 中 定义 并 指定 了 相应 的 位 数 。 

与 AF_INET 域 相 比较 ，IPv6 因 特 网 域 (AF_INET6) 套 接 字 地 址 用 
结构 sockaddr_in6 表 示 : 

struct_in6_addr { 


uint8 t s6 addr[16]; /* [Pv6 address */ 
}; 
struct sockaddr_in6 { 
sa_family_t sin6 family; /* address family */ 
in port t sin6 port; /* port number */ 
uint32 t sin6 flowinfo; /* traffic class and 
flow info */ 
struct in6. addr sino addr; /* [Pv6 address*/ 
uint32 t sin6 scope id; /* set of interfaces 


for scope */ 


E 


这 些 都 是 Single UNIX Specification 要 求 的 定义 。 每 个 实现 可 以 自由 
添加 更 多 的 字段 。 例 如 ， 在 Linux 中 ，sockaddr in 定义 如 下 : 


struct sockaddr in ( 


sa family t sin family; /* address family */ 
in port t sin port; /* port number */ 
struct in6. addr sino addr; /* [Pv4 address */ 
unsigned char sin zero[8]; /* filler */ 

js 

其 


中 成 员 sin_zero 为 填充 字段 ， 应 该 全 部 被 置 为 0。 
注意 ， 尽 管 sockaddr_in 5 sockaddr in6 结构 相差 比较 大 ， 但 它们 
均 被 强制 转换 成 sockaddr 结 构 输 入 到 套 接 字 例 程 中 。 在 17.2 方 ， 将 会 
到 UNIX 域 套 接 字 地 址 的 结构 与 上 述 两 个 因特网 域 套 接 字 地 址 格式 的 不 
la] o 
有 时 ， 需 要 打印 出 能 被 人 理解 而 不 是 计算 机 所 理解 的 地 址 格式 。 
BSD 网 络 软件 包含 函数 inet_addr 和 inet_ntoa， 用 于 二 进 制 地 址 格式 与 
点 分 十 进 制 字符 表示 (a.b.c.d) 之 间 的 相互 转换 。 但 是 这 些 函 数 仅 适 用 
于 IPv4 地 址 。 有 两 个 新 函数 inet_ntop 和 inet_pton 具 有 相似 的 功能 ， 而 且 
同时 文 持 IPv4 地 址 和 IPv6 地 址 。 
#include <arpa/inet.h> 
const char *inet_ntop(int domain, const void *restrict addr, 
char *restrict str, socklen_t size); 
返回 值 : 者 成 功 ， 返 回 地 址 字符 串 指 针 ; ate, XEK[EINULL 
int inet pton(int domain, const char * restrict str, 
void *restrict addr); 
REME: EH, REL ARIE, illo; ete, wel- 
函数 inet_ntop 将 网 络 字 节 序 的 二 进 制 地 址 转换 成 文本 字符 串 格 
式 。inet_pton 将 文本 字符 串 格 式 转换 成 网 络 字 节 序 的 二 进 制 地 址 。 参 


数 domain 仅 支持 两 个 值 : AF INETTIAF. INET6 ° 

对 于 inet_ntop， 参 数 size 指 定 了 保存 文本 字符 串 的 缓冲 区 (sr) 的 
大 小 。 两 个 常数 用 于 简化 工作 : INET_ADDRSTRLEN 定义 了 足够 大 的 
空间 来 存放 一 个 表示 IPv4 地 址 的 文本 字符 早 ; INET6_ADDRSTRLEN 
定义 了 足够 大 的 空间 来 存放 一 个 表示 IPv6 地 址 的 文本 字符 串 。 对 于 
inet_pton， 如 果 domain 是 AF_INET， 则 缓冲 区 addr 需 要 足够 大 的 空间 来 
存放 一 个 32 位 地 址 ， 如 果 domain 是 AF_INET6， 则 需要 足够 大 的 空间 来 
存放 一 个 128 位 地 址 。 


16.3.3 地 址 查询 


理想 情况 下 ， 应 用 程序 不 需要 了 解 一 个 套 接 字 地 址 的 内 部 结构 。 
如 果 一 个 程序 简单 地 传递 一 个 类 似 于 sockaddr 结 构 的 套 接 字 地 址 ， 并 且 
不 依赖 于 任何 协议 相关 的 特性 ， 那 么 可 以 与 提供 相同 类 型 服务 的 许多 
不 同 协议 协作 。 

ABE, BSD 网 络 软件 提供 了 访问 各 种 网 络 配 置信 息 的 接口 。6.7 
廊 简 要 讨论 了 网 络 数据 文件 和 用 来 访问 这 些 文件 的 画 数 。 本 市 将 更 评 
细 地 讨论 一 些 细 和 ， 并 且 引 入 新 的 函数 来 查询 寻 址 信息 。 

这 些 函 数 返 回 的 网 络 配置 信息 被 存放 在 许多 地 方 。 这 个 信息 可 以 
存放 在 静态 文件 (如 /etc/hosts 和 /etc/services) 中 ， 也 可 以 由 名 字 服 务 
管理 ， 如 域名 系统 (Domain Name System, DNS) 或 者 网 络 信息 服务 

(Network Information Service, NIS) 。 无 论 这 个 信息 放 在 何 处 ， 都 可 
以 用 同样 的 函数 访问 它 。 
通过 调用 gethostent， 可 以 找到 给 定 计算 机 系统 的 主机 信息 。 
#include <netdb.h> 


struct hostent *gethostent(void); 


返回 值 ， 儿 成功， 返回 指针 ;， 铬 出 错 ， 返 回 NULL 


void sethostent(int stayopen); 

void endhostent(void); 

ON R EDL A Ha PE CR A FIF, gethostent 11 F E ° ER 2X 
gethostent 返 回 文 件 中 的 下 一 个 条 目 。 琴 数 sethostent 会 打开 文件 ， 如 果 
文件 已 经 被 打开 ， 那 么 将 其 回 绕 。 当 stayopen 参 数 设 置 成 非 0 值 时 ， 调 
FigethostentZ Ja, SC PEORES EFT FF AY © Ex Zi endhostent n] LA HH] 5C 
fft © 

=“ gethostenti IAT, 388 — T T8 IR] hostentZ& T9 R38 tT, ears 
HI BEBE PPA AA, BEV VA] Hgethostent, i psp zs qx 
fa tz. ° hostentZ& T4 B/> EJ DJ, PED: struct hostent( 


char *h name; /* name of host */ 

char  **h aliases; /* pointer to alternate host name array */ 
int h_addrtype; /* address type */ 

int h_length; /* length in bytes of address */ 


char  **h addr list; /* pointer to array of network addresses */ 


H 

EHER FH PE FF 

JY WI BX gethostbynamefll gethostbyaddr, AKEE fEhostent K 
数 中 ， 现 在 则 被 认为 是 过 时 的 。SUSv4 已 经 删除 了 它们 。 马 上 将 会 看 到 
它们 的 奉 代 函数 。 

能 够 采用 一 套 相似 的 接口 来 获得 网 络 名 字 和 网 络 编号 。 

#include <netdb.h> 

struct netent *getnetbyaddr (uint32_t net, int type); 

struct netent *getnetbyname(const char *name); 


struct netent *getnetent(void); 


3 个 函数 的 返回 值 : AA, RE: Ait, GRIBINULL 


void setnetent(int stayopen); 
void endnetent(void); 
netent 结 构 至 少 包 含 以 下 字段 : 


struct netent { 


char *n name; /* network name */ 

char **n aliases; /* alternate network name array pointer */ 
int n addrtype;  /* address type */ 

uint32 t n net; /* network number */ 


Js 
网 络 编号 按照 网 络 字 节 序 返回 。 地 址 类 型 是 地 址 族 常 量 之 一 〈 如 
AF INET) 。 
我 们 可 以 用 以 下 函数 在 协议 名 字 和 协议 编号 之 间 进 行 映 射 。 
#include <netdb.h> 
struct protoent *getprotobyname(const char *name); 
struct protoent *getprotobynumber(int proto); 
struct protoent *getprotoent(void); 
3 个 函数 的 返回 值 : ARD, AEE: ate, iKIEINULL 
void setprotoent(int stayopen); 
void endprotoent(void); 
POSIX.1 定 义 的 protoent 结 构 至 少 包含 以 下 成 员 : 


struct protoent { 


char *p_name; /* protocol name */ 
char  **p aliases; /* pointer to altername protocol name 
array */ 


int | proto; /* protocol number */ 
p.p p 


3 
服务 是 由 地 址 的 端口 号 部 分 表示 的 。 每 个 服务 由 一 个 唯一 的 众 所 
周知 的 端口 号 来 文 持 。 可 以 使 用 函数 getservbyname 将 一 个 服务 名 映射 
到 一 个 端口 号 ， 使 用 函 数 getservbyport 将 一 个 端口 号 映 映 到 一 个 服务 
名 ， 使 用 函数 getservent 顺 序 扫描 服务 数据 库 。 

#include <netdb.h> 


struct servent *getservbyname(const char *name, const char *proto); 
struct servent *getserbyport(int port, const char *proto); 
struct servent *getservent(void); 

3 个 函数 的 返回 值 : EBD], EE, ats, iKIEINULL 
void setservent(int stayopen); 
void endservent(void); 
servent 结 构 至 少 包含 以 下 成 员 : 


struct servent( 


char *s name; /* service name */ 

char  **s aliases; /* pointer to alternate service name array 
2 

int s port; /* port number */ 

char  *s proto; /* name of protocol */ 

[| 

[| 

[| 

js 


POSIX.1 定 义 了 者 干 新 的 函数 ， 人 允许 一 个 应 用 程序 将 一 个 主机 名 和 
一 个 服务 名 映射 到 一 个 地 址 ， 或 者 反之 。 这 些 玉 数 代 蔡 了 较 老 的 函数 
gethostbyname fil gethostbyaddr ° 

getaddrinfo 函 数 允 许 将 一 个 主机 名 和 一 个 服务 名 映射 到 一 个 地 址 。 

#include <sys/socket.h> 


#include <netdb.h> 


int getaddrinfo(const char *restrict host, 
const char *restrict service, 
const struct addrinfo *restrict hint, 
struct addrinfo **restrict res); 
返回 值 : ARD, Xx[BO; 大 出错， 返回 非 0 钳 误 码 
void freeaddrinfo(struct addrinfo *ai); 
需要 提供 主机 名 、 服 务 名 ， 或 者 两 者 都 提供 。 如 果 仅 仅 提供 一 个 
和 名字， 男 外 一 个 必须 是 一 个 空 指 针 。 主 机 名 可 以 是 一 个 节操 名 或 所 分 
格式 的 主机 地 址 。 
getaddrinfo K ŽUR E] — 1 8E 3€ Zi T4 addrinfo ° FY DA FB freeaddrinfo 来 
释放 一 个 或 多 个 这 种 结构 ， 这 取决 于 用 ai_next 字 段 链 接 起 来 的 结构 有 


多 少 。 


addrinfo 结 构 的 定义 至 少 包 含 以 下 成 员 : 


struct addrinfo ( 


int ai flags; /* customize behavior */ 

int ai family; /* address family */ 

int ai socktype; /* socket type */ 

int ai protocol; /* protocol */ 

socklen t ai addrlen; /* length in bytes of 
address */ 

struct sockaddr *ai addr; /* address */ 

char *ai_canonname; /* canonical name of 
host */ 

struct addrinfo *ai_next; /* next in list */ 


}; 


可 以 提供 一 个 可 选 的 hint 来 选择 符合 特定 条 件 的 地 址 。hint 是 一 个 
用 于 过 滤 地 址 的 模板 ， 包 括 ai family ` ai_flags ` ai_protocol 和 
ai_socktype 字 段 。 剩 余 的 整数 字段 必须 设置 为 0， 指 针 字 段 必 须 为 空 。 
图 16-7 总 结 了 ai_flags 字 段 中 的 标志， 可 以 用 这 些 标志 来 目 定义 如 何 处 
理 地 址 和 和 名字 。 


ADDRCONFIG 查询 配置 的 地 址 类 型 (IPv4 或 IPv6) 
Baye 查找 IPv4 和 IPv6 地 址 〈 仅 用 于 AI. VAMAPPED) 
_CANONNAME 需要 一 个 规范 的 名 字 ( 与 别名 相对 ) 
_NUMERICHOST 以 数字 格式 指定 主机 地 址 ， 不 翻译 
_NUMERICSERV 将 服务 指定 为 数字 端口 号 ， 不 翻译 
_PASSIVE 套 接 字 地 址 用 于 监听 绑 定 
V4MAPPED 如 没有 找到 IPv6 地 址 ， 返 回 映射 到 IPv6 格式 的 PPv4 地 址 


A 
A 
A 
A 
A 
A 
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图 16-7 addrinfo 结 构 的 标志 
如 果 getaddrinfo 失 败 ， 不 能 使 用 perror 或 strerror 来 生成 错误 消 居 ， 
而 是 要 调用 gai_strerror 将 返回 的 错误 码 转换 成 错误 消 轧 。 
#include <netdb.h> 


const char *gai_strerror(int error); 
返回 值 : 指向 描述 错误 的 字符 串 的 指针 
getnameinfo 函 数 将 一 个 地 址 转换 成 一 个 主机 名 和 一 个 服务 名 。 
#include <sys/socket.h> 
#include <netdb.h> 
int getnameinfo(const struct sockaddr *restrict addr, socklen_t alen, 
char *restrict host, socklen_t hostlen, 
char *restrict service, socklen_t servlen, int flags); 
返回 值 : ERJ, wo; Anite, wE 
套 接 字 地 址 (addr) 被 翻译 成 一 个 主机 名 和 一 个 服务 名 。 如 果 host 
韭 空 ， 则 指向 一 个 长 度 为 hostlen 字 广 的 缓冲 区 用 于 存放 返回 的 主机 


名 。 同 样 ， 如 果 service 非 空 ， 则 指向 一 个 长 度 为 servlen 字 市 的 缓冲 区 用 
于 存放 返回 的 主机 和 名。 
flags 参 数 提供 了 一 些 控制 翻译 的 方式 。 图 16-8 总 结 了 文 持 的 标志 “。 


NI DGRAM 服务 基于 数据 报 而 非 基 于 流 
NI NAMEREQD 如 果 找 不 到 主机 名 ， 将 其 作为 一 个 错误 对 待 


NI_NOFQDN 对 于 本 地 主机 ， 仅 返回 全 限定 域名 的 节点 名 部 分 
NI_NUMERICHOST 返回 主机 地 址 的 数字 形式 ， 而 非 主 机 名 

NI_NUMERICSCOPE 对 于 了 Pv6， 返 回 范围 ID 的 数字 形式 ， 而 非 名 字 
NI_NUMERICSERV 返回 服务 地 址 的 数字 形式 〈 即 端口 号 )， 而 非 名 字 


图 16-8 getnameinfo 函 数 的 标志 


实例 
图 16-9 说 明了 getaddrinfo 函 数 的 使 用 方法 。 


#include "apue.h" 

#if defined (SOLARIS) 
#include <netinet/in.h> 
#endif 

#include <netdb.h> 
#include <arpa/inet.h> 
Sif defined(BSD) 
#include <sys/socket.h> 


#include <netinet/in.h> 
#endif 


void 
print_family(struct addrinfo *aip) 
{ 

printf(" family: "y; 

switch (aip-»ai family) { 

case AF INET: 


printf ("inet"); 
break; 

case AF INET6: 
printf ("inet6") ; 
break; 

case AF UNIX: 
printf ("unix"); 
break; 

case AF UNSPEC: 
printf ("unspecified"); 
break; 

default: 
printf ("unknown"); 


void 
print type(struct addrinfo *aip) 
{ 
printf(" type "); 
switch (aip->ai_socktype) { 
case SOCK_STREAM: 
printf ("stream"); 
break; 
case SOCK_DGRAM: 
printf ("datagram"); 
break; 
case SOCK SEQPACKET: 
printf ("seqpacket") ; 
break; 
case SOCK_RAW: 
printf ("raw") ; 
break; 
default: 
printf ("unknown ($d)", aip->ai_socktype) ; 


void 
print_protocol (struct addrinfo *aip) 
{ 
printf(" protocol "); 
switch (aip-»ai protocol) { 
case 0: 
printf ("default"); 
break; 
case IPPROTO TCP: 
printf ("TCP") ; 
break; 
case IPPROTO_UDP: 
printf ("UDP") ; 
break; 
case IPPROTO RAW: 
printf ("raw"); 
break; 


default: 
printf("unknown (%d)", aip-»ai protocol); 


void 
print flags(struct addrinfo *aip) 
{ 
printf ("flags") ; 
if (aip->ai_flags == 0) { 
pràántt£t(" 05); 
) else { 
if (aip-»ai flags & AI PASSIVE) 
printf(" passive"); 
if (aip-»ai flags & AI CANONNAME) 
printf(" canon"); 
if (aip-»ai flags & AI NUMERICHOST) 
printf(" numhost"); 
if (aip-»ai flags & AI NUMERICSERV) 
printf(" numserv"); 
if (aip-»ai flags & AI V4MAPPED) 
printf(" v4mapped"); 
if (aip-»ai flags & AI ALL) 
printf(" all"); 


int 
main(int argc, char *argv[]) 


( 


struct addrinfo *ailist, *aip; 

struct addrinfo hint; 

struct sockaddr_in *sinp; 

const char *addr; 

int err; 

char abuf[INET ADDRSTRLEN]; 
if (argc !- 3) 


err quit("usage: $s nodename service", argv[0]); 
hint.ai flags = AI CANONNAME; 
hint.ai family - 0; 
hint.ai socktype - 
hint.ai protocol - 
hint.ai addrlen = 0; 
hint.ai canonname - NULL; 
hint.ai addr = NULL; 
hint.ai next = NULL; 
if ((err = getaddrinfo(argv[1], argv[2], &hint, &ailist)) != 0) 
err quit("getaddrinfo error: $s", gai strerror(err)); 
for (aip = ailist aip !- NULL; aip = aip-»ai next) { 
print flags (aip); 
print family (aip); 
print type (aip); 
print protocol (aip); 
printf("\n\thost $s", aip->ai canonname?aip-»ai canonname:"-"); 


if (aip-»ai family == AF INET) { 
sinp = (struct sockaddr in *)aip-»ai addr; 
addr = inet ntop(AF INET, &sinp-»sin addr, abuf, 
INET ADDRSTRLEN) ; 
printf(" address $s", addr?addr:"unknown"); 
printf(" port $d", ntohs(sinp->sin_port)); 
) 
prüntf("Nn*); 
} 
exit (0); 


图 16-9 打印 主机 和 服务 信息 

这 个 程序 说 明了 getaddrinfo 函数 的 使 用 方法 。 如 果 有 多 个 协议 为 
指定 的 主机 提供 给 定 的 服务 ， 程 序 会 打印 出 多 条 信息 。 本 实例 仅 打印 
了 与 IPv4 一 起 工作 的 那些 协议 (ai_family 为 AF_INET) 的 地 址 信息 。 如 
末 想 将 输出 限制 在 AF_INET 协 议 族 ， 可 以 在 提示 中 设置 ai_ family 字 
E o 


在 一 个 测试 系统 上 运行 这 个 程序 时 ， 得 到 了 以 下 输出 : 
$ /a.out harry nfs 
flags canon family inet type stream protocol TCP 
host harry address 192.168.1.99 port 2049 
flags canon family inet type datagram protocol UDP 
host harry address 192.168.1.99 port 2049 


16.3.4 与 地 址 关联 


将 一 个 客户 端的 套 接 字 关 联 上 一 个 地 址 没有 多 少 新 意 ， 可 以 让 系 
统 选 一 个 默认 的 地 址 。 然 而 ， 对 于 服务 器 ， 需 要 给 一 个 接收 客户 端 请 
求 的 服务 需 套 接 字 关联 上 一 个 众所周知 的 地 址 。 客 户 端 应 有 一 种 方法 
来 发 现 连接 服务 器 所 需要 的 地 址 ， 最 简单 的 方法 就 是 服务 器 保留 一 个 
地 址 并 且 注 册 在 /etc/services 或 者 某 个 名 字 服 务 中 。 

使 用 bind 函 数 来 关联 地 址 和 套 接 字 。 


#include <sys/socket.h> 
int bind(int sockfd, const struct sockaddr *addr, socklen_t len); 
返回 值 : TAD), welo; Awe, we- 
对 于 使 用 的 地 址 有 以 下 一 些 限制 。 
"在 进程 正在 运行 的 计算 机 上 ， 指 定 的 地 址 必须 有 效 ; 不 能 指定 一 
个 其 他 机 各 的 地 址 。 
"地 址 必须 和 创建 套 接 字 时 的 地 址 族 所 支持 的 格式 相 匹 配 。 
地址 中 的 端口 号 必须 不 小 于 1 024， 除 非 该 进程 具有 相应 的 特权 
( 即 超级 用 户 ) 。 
“一 般 只 能 将 一 个 套 接 字 端 点 绑 定 到 一 个 给 定 地 址 上， 尽管 有 些 协 
议 允 许多 重 绑 定 。 
对 于 因特网 域 ， 如 果 指 定 耳 地 址 为 INADDR_ANY (<netinet/in.h> 
中 定义 的 ) ， 套 接 字 端 点 可 以 被 绑 定 到 所 有 的 系统 网 络 接口 上 。 这 意 
味 着 可 以 接收 这 个 系统 所 安装 的 任何 一 个 网 卡 的 数据 包 。 在 下 一 节 中 
可 以 看 到 ， 如 果 调 用 connect 或 listen， 但 没有 将 地 址 绑 定 到 套 接 字 
上 ， 系 统 会 选 一 个 地 址 绑 定 到 套 接 字 上 。 
可 以 调用 getsockname 函 数 来 发 现 绑 定 到 套 接 字 上 的 地 址 。 


#include <sys/socket.h> 


int getsockname(int sockfd, struct sockaddr *restrict addr, 
socklen_t *restrict alenp); 
返回 值 : ERJ, welo; Awe, e- 

调用 getsockname 之 前 ， 将 alenp WHE AP Fee ABET, iX 
整数 指定 缓冲 区 sockaddr 的 长 度 。 返 回 时 ， 该 整数 会 被 设置 成 返回 地 址 
的 大 小 。 如 有 果 地 址 和 提供 的 缓冲 区 长 度 不 匹配 ， 地 址 会 被 目 动 截断 而 
不 报错 。 如 采 当 前 没有 地 址 绑 定 到 该 套 接 字 ， 则 其 结果 是 未 定义 的 。 

如 末 公 接 字 已 经 和 对 等 方 连 授 ， 可 以 调用 getpeemame 了 芳 数 来 找到 
对 方 的 地 址 。 


#include <sys/socket.h> 
int getpeername(int sockfd, struct sockaddr *restrict addr, 
socklen_t *restrict alenp); 
IRE: AA, welo EE, we- 
除了 返回 对 等 方 的 地 址 ， 函 数 getpeername 和 getsockname 一 样 。 


16.4 建立 连接 


如 果 要 处 理 一 个 面向 连接 的 网 络 服务 (SOCK STREAM 或 
SOCK SEQPACKET) ， 那 么 在 开始 交换 数据 以 前 ， 需 要 在 请 求 服 务 的 
进程 套 接 字 (客户 端 和 提供 服务 的 进程 套 接 字 (服务 器 ) 之 间 建 立 
一 个 连接 。 使 用 connect 函 数 来 建立 连接 。 


#include <sys/socket.h> 


int connect(int sockfd, const struct sockaddr *addr, socklen_t len); 
返回 值 : eA, Reo; AE, we- 
在 connect 中 指定 的 地 址 是 我 们 想 与 之 通信 的 服务 器 地 址 。 如 采 
sockfd 没 有 绑 定 到 一 个 地 址 ，connect 会 给 调用 者 绑 定 一 个 默认 地 址 © 
当 莹 试 连接 服务 右 时 ， 出 于 一 些 原因 ， 连 接 可 能 会 失败 。 要 想 一 
个 连接 请 求 成 功 ， 要 连接 的 计算 机 必须 是 开局 的 ， 并 且 正 在 运行 ， 服 
务 器 必须 绑 定 到 一 个 想 与 之 连接 的 地 址 上， 并且 服务 器 的 等 待 连接 队 
列 要 有 足够 的 空间 SERE A 78) 。 因 此 ， 应 用 程序 必须 
能 够 处 理 connect 返 回 的 错误 ， 这 些 错误 可 能 是 由 一 些 瞬 时 条 件 引 起 
的 。 
实例 
图 16-10 显示 了 一 种 如 何 处 理 瞬 时 connect 错误 的 方法 。 如 果 一 个 
服务 右 运 行 在 一 个 负载 很 重 的 系统 上 ， 束 很 有 可 能 发 生 这 些 错误 。 


#include "apue.h" 
#include <sys/socket.h> 


#define MAXSLEEP 128 


int 


connect_retry(int sockfd, const struct sockaddr *addr, socklen_t alen) 


int numsec; 


/* 
* Try to connect with exponential backoff. 
rA 
for (numsec = 1; numsec <= MAXSLEEP; numsec ««- 1) { 
if (connect(sockfd, addr, alen) == 0) { 
/* 
* Connection accepted. 
x 
return(0); 
} 
/* 
* Delay before trying again. 
UA 


if (numsec <= MAXSLEEP/2) 
sleep (numsec) ; 
} 


return (-1); 


图 16-10 支持 重 试 的 connect 


这 个 函数 展示 了 指数 补偿 (exponential backoff) 算法 。 如 果 调 用 
connect 失 败 ， 进 程 会 休眠 一 小 段 时 间 ， 然 后 进入 下 次 循环 再 次 尝试 ， 
每 次 循环 休眠 时 间 会 以 指数 级 增加 ， 直 到 最 大 延迟 为 2 分 钟 左右 。 

然而 图 16-10 中 的 代码 存在 一 个 问题 : 代码 是 不 可 移植 的 。 它 在 
Linuxz 和 Solaris 上 可 以 工作 ， 但 是 在 FreeBSD 和 Mac OS X 上 却 不 能 按 预 
期 工作 。 在 基于 BSD 的 套 接 字 实 现 中 ， 如 果 第 一 次 连接 尝试 失败 ， 那 
么 在 TCP 中 继续 使 用 同一 个 套 接 字 描述 待 ， 接 下 来 仍旧 会 失败 。 这 残 是 
一 个 协议 相关 的 行为 从 (协议 无 关 的 ) 套 接 字 接 口中 显露 出 来 变 得 应 


用 程序 可 见 的 例子 。 这 些 都 是 历史 原因 ， 因 此 Single UNIX Specification 
警告 ， 如 果 connect 失 败 ， 套 接 字 的 状态 会 变 成 未 定义 的 。 

因此 ， 如 果 connect 失败 ， 可 迁移 的 应 用 程序 需要 关闭 套 接 字 。 如 
果 想 重 试 ， 必 须 打 开 一 个 新 的 套 接 字 。 这 种 更 易于 迁移 的 技术 如 图 16- 
11 所 示 。 


#include "apue.h" 
#include <sys/socket.h> 


#define MAXSLEEP 128 


ine 
connect_retry(int domain, int type, int protocol, 

const struct sockaddr *addr, socklen_t alen) 
{ 


int numsec, fd; 


/* 

* Try to connect with exponential backoff. 

Fe; 

for (numsec = 1; numsec <= MAXSLEEP; numsec <<= 1) { 


if ((fd = socket (domain, type, protocol)) < 0) 
return (-1); 


if (connect(fd, addr, alen) == 0) { 
/* 
* Connection accepted. 
XJ 
return (fd); 
} 
close (fd); 


/* 
* Delay before trying again. 
X/ 
if (numsec <= MAXSLEEP/2) 
sleep (numsec) ; 
} 


return(-1); 


图 16-11 可 迁移 的 文 持 重 试 的 连接 代码 


需要 注意 的 是 ， 因 为 可 能 要 建立 一 个 新 的 套 接 字 ， 给 connect_retry 
函数 传递 一 个 套 接 字 描 述 符 参 数 是 没有 意义 。 我 们 现在 返回 一 个 已 连 


接 的 套 接 字 摘 述 符 给 调用 者 ， 而 并 非 返回 一 个 表示 调用 成 功 的 值 。 

如 有 果 套 接 字 描 述 符 处 于 非 阻 塞 模式 (该 模式 将 在 16.8 节 中 进一步 
Wie) ， 那 么 在 连接 不 能 马上 建立 时 ，connect 将 会 返回 -1 并 且 将 errno 
设置 为 特殊 的 错误 码 EINPROGRESS。 应 用 程序 可 以 使 用 poll 或 者 select 
来 判断 文件 描述 符 何 时 可 写 。 如 采 可 写 ， 连 接 完成 。 

connect 函 数 还 可 以 用 于 无 连接 的 网 络 服务 (SOCK DGRAM) 
这 看 起 来 有 点 矛盾 ， 实 际 上 却 是 一 个 不 错 的 选择 。 如 果 用 
SOCK_DGRAM 套 接 字 调用 connect， 传 送 的 报 文 的 目标 地 址 会 设置 成 
connect 调 用 中 所 指定 的 地 址 ， 这 样 每 次 传送 报 文 时 就 不 需要 再 提供 地 
址 。 另 外 ， 仅 能 接收 来 目 指定 地 址 的 报 文 。 

服务 器 调用 listen 函 数 来 宣告 它 愿 意 接 受 连接 请 求 。 


#include <sys/socket.h> 


int listen(int sockfd, int backlog); 
返回 值 : ARJ, EO; Amis, Ael- 

参数 backlog 提 供 了 一 个 提示 ， 提 示 系 统 该 进程 所 要 入 队 的 未 完成 
连接 请 求 数量 。 其 实际 值 由 系统 决定 ， 但 上 限 由 <sys/socket.h> 中 的 
SOMAXCONN 指 定 。 

Solaris 系 统 忽略 了 <sys/socket.h> 中 的 SOMAXCONN“。 具 体 的 最 大 
值 取决 于 每 个 协议 的 实现 。 对 于 TCP， 其 默认 值 为 128。 

一 旦 队列 满 ， 系 统 束 会 拒绝 多 余 的 连接 请 求 ， 所 以 backlog 的 值 应 
该 基于 服务 事 期 望 负载 和 处 理 量 来 选择 ， 其 中 处 理 量 是 指 接受 连接 请 
求 与 局 动 服务 的 数量 。 

一 旦 服务 句 调 用 了 listen， 所 用 的 套 接 字 就 能 接收 连接 请 求 。 使 用 
accept 函 数 获 得 连接 请 求 并 建立 连接 。 


#include <sys/socket.h> 


int accept(int sockfd, struct sockaddr *restrict addr, 


socklen_t *restrict len); 


返回 值 ， 若 成 功 ， 返 回 文件 (BRF) 描述 符 ， 若 出 错 ， 返 回 -1 

函数 accept 所 返回 的 文件 描述 符 是 套 接 字 搞 述 符 ， 该 描述 符 连 接 到 
调用 connect 的 客户 端 。 这 个 新 的 套 接 字 描 述 符 和 原始 套 接 字 (sockfd) 
有 具有 相同 的 套 接 字 类 型 和 地 址 族 。 传 给 accept 的 原始 套 接 字 没 有 关联 到 
这 个 连接 ， 而 是 继续 保持 可 用 状态 并 接收 其 他 连接 请 求 。 

如 果 不 天 心 客 户 端 标识 ， 可 以 将 参数 addr 和 len 设 为 NULL ° F, 
在 调用 accept 之 前 ， 将 addr 参 数 设 为 足够 大 的 缓冲 区 来 存放 地 址 ， 并 且 
将 len 指 癌 的 整数 设 为 这 个 缓冲 区 的 字 节 大 小 。 返 回 上 时，accept 会 在 缓冲 
区 填充 客户 端的 地 址 ， 并 且 更 新 指向 len 的 整数 来 反映 该 地 址 的 大 小 。 

如 果 没 有 连接 请 求 在 等 待 ，accept 会 阻塞 直到 一 个 请 求 到 来 。 如 果 
sockfd 处 于 非 阻塞 模式 ， accept 会 返回 -1， 并 将 ermo 设 置 为 EAGAIN 或 
EWOULDBLOCK ? 

本 文中 讨论 的 所 有 平台 都 将 EAGAIN 定 义 为 EWOULDBLOCK ° 

如 宁 服 务 器 调用 accept， 并 且 当 前 没有 连接 请 求 ， 服 务 硕 会 阻塞 直 
到 一 个 请 求 到 来 。 男 外 ， 服 务 絮 可 以 使 用 poll 或 select 来 等 待 一 个 请 求 的 
到 来 。 在 这 种 情况 下 ， 一 个 市 有 等 待 连接 请 求 的 套 接 字 会 以 可 读 的 方 
式 出 现 。 

实例 

图 16-12 显 示 了 一 个 函数 ， 可 以 用 来 分 配 和 初始 化 套 接 字 供 服务 器 
进程 使 用 。 


#include "apue.h" 
#include <errno.h> 
#include <sys/socket.h> 


int 
initserver(int type, const struct sockaddr *addr, socklen_t alen, 
int qlen) 
{ 
Tnt fd; 
int err = 0; 


if ((fd = socket(addr-»sa family, type, 0)) < 0) 
return(-1); 

if (bind(fd, addr, alen) < 0) 
goto errout; 

if (type == SOCK_STREAM || type == SOCK_SEQPACKET) { 
if (listen(fd, qlen) < 0) 

goto errout; 
} 


return (fd); 


errout: 
err = errno; 
close (fd); 
errno = err; 
return(-1); 


图 16-12 初始 化 一 个 套 接 字 端点 供 服务 器 进程 使 用 

可 以 看 到 ，TCP 有 一 些 奇 怪 的 地 址 复 用 规则 ， 这 使 得 这 个 例子 不 完 
备 。 疼 16-22 显 示 了 有 关 这 个 函数 的 邦 一 个 版 本 ， 可 以 绕 过 这 些 规则 ， 
解决 此 版 本 的 主要 缺陷 。 


16.5 数据 传输 


既然 一 个 套 接 字 端 点 表示 为 一 个 文件 描述 符 ， 那 么 只 要 建立 连 
接 ， 融 可 以 使 用 read 和 write 来 通过 套 接 字 通 信 。 回 忆 前 面 所 讲 ， 通 过 在 
connect 函数 里 面 设置 默认 对 等 地 址 ， 数 据 报 套 接 字 也 可 以 被 “连接 ”。 
在 套 接 字 描 述 符 上 使 用 read 和 write 是 非常 有 意义 的 ， 因 为 这 意味 着 可 以 
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还 可 以 安排 将 套 接 字 描述 符 传 递 给 子 进程 ， 而 该 子 进程 执行 的 程序 并 
INT REEF ° 

Rar] LM read write P230) ,— (LI I PA T ER BUT BE AY) 
一 切 。 如 采 想 指定 选项 ， 从 多 个 客户 端 接收 数据 包 ， 或 者 发 送 市 外 数 
据 ， 束 需要 使 用 6 个 为 数据 传递 而 设计 的 套 接 字画 数 中 的 一 个 。 

3 个 函数 用 来 发 送 数 据 ，3 个 用 于 接收 数据 。 首 先 ， 考 得 用 于 发 送 
数据 的 函数 。 

最 简 持 的 是 send， 它 和 write 很 像 但 是 可 以 指定 标志 来 改变 处 理 
传输 数据 的 方式 。 


#include <sys/socket.h> 


ssize t send(int sockfd, const void *buf, size t nbytes, int flags); 
返回 值 : ERJ, WARIS DANG Afs, xe- 
类 似 write， 使 用 send 时 套 接 字 必 须 已 经 连接 。 参 数 buf 和 nbytes 的 含 
义 与 write 中 的 一 致 。 
然而 ， 与 write 不 同 的 是 ，send 文 持 第 4 个 参数 flags。3 个 标志 是 由 
Single UNIX Specification 定 义 的 ， 但 是 具体 系统 实现 支持 其 他 标志 的 情 
况 也 是 很 常见 的 。 图 16-13 总 结 了 这 些 标 志 。 


n Linux ien OS cn 


MSG CONFIRM 提供 链 路 层 反 馈 以 保持 地 址 映 
射 有 效 

MSG_DONTROUT 勿 将 数据 包 路 由 出 本 地 网 络 

MSG DONTWAIT 允许 非 阻 塞 操作 (等 价 于 使 用 
O NONBLOCK) 

MSG EOF 发 送 数据 后 关闭 套 接 字 MRE i 

MSG_EOR 如 果 协 议 支 持 ， 标 记 记 录 结 束 

MSG MORE 延迟 发 送 数据 包 人 允许 写 更 多 数据 

MSG_NOSIGNRL 在 写 无 连接 的 套 接 字 时 不 产生 
SIGPIPE 信号 

MSG_OOB 如 果 协 议 支 持 ， 发 送 带 外 数据 
CJ, 16.7 节 ) 


图 16-13 send 套 接 字 调用 标志 

即使 send 成 功 返 回 ， 也 并 不 表示 连接 的 另 一 端的 进程 就 一 定 接收 了 
数据 。 我 们 所 能 保证 的 只 是 当 send 成 功 返 回 时 ， 数 据 已 经 被 无 错误 地 发 
送 到 网 络 驱 动 程序 上 。 

对 于 支持 报 文 边界 的 协议 ， 如 有 果 尝 斌 发送 的 单个 报 文 的 长 度 超过 
协议 所 支持 的 最 大 长 度 ， 那 么 send 会 失败 ， 并 将 errno 设 为 EMSGSIZE ° 
对 于 字 节 流 协 议 ，send 会 阻塞 直到 整个 数据 传输 完成 。 函 数 sendto 和 
send 很 类 似 。 区 别 在 于 sendto 可 以 在 无 连接 的 套 接 字 上 指定 一 个 目标 地 
址 。 


#include <sys/socket.h> 


ssize t sendto(int sockfd, const void *buf, size t nbytes, int flags, 
const struct sockaddr *destaddr, socklen t destlen); 
返回 值 : ERI, GRAAF DANG ata, e- 
对 于 面向 连接 的 套 接 字 ， 目 标 地 址 是 被 包 略 的 ， 因 为 连接 中 隐 含 
了 目标 地 址 。 对 于 无 连接 的 套 接 字 ， 除 非 完 调用 connect 设 置 了 目标 地 
址 ， 否 则 不 能 使 用 send。sendto 提 供 了 发 送 报 文 的 男 一 种 方式 。 
通过 套 搂 字 发 送 数据 时 ， 还 有 一 个 选择 。 可 以 调用 融 有 msghdr 结 
构 的 sendmsg 来 指定 多 重 缓冲 区 传输 数据 ， 这 和 writev 函 数 很 相似 (I 
14.6 17) 
#include <sys/socket.h> 
ssize_t sendmsg(int sockfd, const struct msghdr *msg, int flags); 
返回 值 : ERI, GR AGA DA ata, e- 
POSIX.1 定 义 了 msghdr 结 构 ， 它 至 少 有 以 下 成 员 : 
struct msghdr { 
void *msg name; /* optional address */ 
socklen t msg namelen; /* address size in bytes */ 


struct iovec *msg. iov; /* array of I/O buffers */ 


int msg iovlen; /* number of elements in array 


"i 
void *msg. control; /* ancillary data */ 
socklen t msg controllen; /* number of ancillary bytes */ 
int msg. flags; /* flags for received message 
2 
h 
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函数 recv 和 read 相 似 ， 但 是 recv 可 以 指定 标志 来 控制 如 何 接收 数 
据 。 
#include <sys/socket.h> 


ssize_t recv(int sockfd, void *buf, size_t nbytes, int flags); 
返回 值 : REF DOES: ATCA ABBOT CAAT a 
R, wHo; 者 出 钳 ， 返 回 -1 
图 16-14 总 结 了 这 些 标志 。 仅 有 3 个 标志 是 Single UNIX Specification 
定义 的 。 


FreeBSD | Linux Mac OS | Solaris 
POSIX 8.0 3.2.0 X 10.6.8 


MSG_CMSG_CLOEXEC 为 UNIX 域 套 接 字 上 接收 的 
文件 描述 符 设 置 执行 时 关闭 标 
志 ( 见 17.4 节 ) 

MSG DONTWAIT 启用 非 阻塞 操作 〈 相 当 于 使 s. 
HH O_NONBLOCK) 

MSG ERRQUEUE 接收 错误 信息 作为 辅助 数据 . 

MSG OOB 如 果 协 议 支 持 ， 获 取 带 外 数 â s è 
He CW 16.7 15) 

MSG_PEEK 返回 数据 包 内 容 而 不 真正 取 . ° s 
走 数据 包 

MSG_TRUNC 即使 数据 包 被 截断 ， 也 返回 
数据 包 的 实际 长 度 

MSG WAITALL 等 待 直到 所 有 的 数据 可 用 ( 仅 . GC $ 
SOCK STREAM) 


图 16-14 recv 套 接 字 调用 标志 


当 指定 MSG_PEEK 标 志 时 ， 可 以 查看 下 一 个 要 读 取 的 数据 但 不 真 
正 取 走 它 。 当 再 次 调用 read 或 其 中 一 个 recv 函 数 时 ， 会 返回 刚才 查看 的 
数据 。 

Xf F SOCK STREAM Sik F , BEA] BU 8 n] DA EC TERR BJ > o 
MSG_WAITALL 标 志 会 阻止 这 种 行为 ， 直 到 所 请 求 的 数据 全 部 返回 ， 
recv ER ZA x 3R [8] ° xf T SOCK_DGRAM fll SOCK, SEQPACKET & #2 
F, MSG WAITALL 标志 没有 改变 什么 行为 ， 因 为 这 些 基于 报 文 的 套 
接 字 类 型 一 次 读 取 束 运 回 整 个 报 文 。 

如 果 发 送 者 已 经 调用 shutdown (4116.27) 来 结束 传输 ， 或 者 网 络 
DMCA HIM RAF A Am BR, ISAS Ae NaS 
接收 完毕 后 ，recv 会 返回 0。 

如 果 有 兴趣 定位 发 送 者 ， 可 以 使 用 recvfrom 来 得 到 数据 发 送 者 的 源 
地 址 。 

#include <sys/socket.h> 

ssize_t recvfrom(int sockfd, void *restrict buf, size_t len, int flags, 


struct sockaddr *restrict addr, 


socklen t *restrict addrlen); 
返回 值 ， 返 回 数 据 的 字 节 长 度 ， 若 无 可 用 数据 或 对 等 方 已 经 按 友 结 
R, Relo; 者 出 销 ， 返 回 -1 

如 果 addr 非 至 ， 它 将 包含 数据 发 送 者 的 套 接 字 端 点 地 址 。 当 调用 
recvfrom 时 ， 需 要 设置 addrlen 参 数 指向 一 个 整数 ， 该 整数 包含 addr 所 指 
向 的 套 接 字 缓 神 区 的 字 节 长 度 。 返 回 时 ， 该 整数 设 为 该 地 址 的 实际 字 
TPKE ° 

ALA nT DARE AAS AL, recvfronil i$ FA TOERNE F © 
否则 ，recvfrom 等 同 于 recv。 

为 了 将 接收 到 的 数据 送 入 多 个 缓冲 区 ， 类 似 于 readv ( 见 14.6 
节 ) ， 或 者 想 接 收 辅助 数据 ( 见 17.4 节 ) ， 可 以 使 用 recvmsg 。 


#include <sys/socket.h> 


ssize t recvmsg(int sockfd, struct msghdr *msg, int flags); 
返回 值 : 返回 数据 的 字 节 长 度 ;， 者 无 可 用 数据 或 对 等 方 已 经 按 序 结 
RW, WO; 大 出 错 ， 返 回 -1 

recvmsg 用 msghdr 结 构 (在 sendmsg 中 见 到 过 ) 指定 接收 数据 的 输 
入 缓冲 区 。 可 以 设置 参数 flags 来 改变 recvmsg 的 默认 行为 。 返 回 时 ， 
msghdr 结 构 中 的 msg_flags 字 上 段 被 设 为 所 接收 数据 的 各 种 特征 。 (进入 
recvmsg 时 msg_flags 被 忽略 。) recvmsg 中 返回 的 各 种 可 能 值 总 结 在 图 
16-15 中 。 我 们 将 在 第 17 章 看 到 使 用 recvmsg 的 实例 。 实 例 : 面向 连接 的 
客户 请 


MSG_CTRUNC 控制 数据 被 截断 
MSG_EOR 接收 记录 结束 符 

MSG ERRQUEUE | 接收 错误 信息 作为 辅助 数据 
MSG OOB 接收 带 外 数据 
MSG_TRUNC - 般 数 据 被 截断 


图 16-15 从 recvmsg 中 返回 的 msg_flags 标 志 


图 16-16 显 示 了 一 个 与 服务 器 通信 的 客户 端 从 系统 的 uptime 命 令 获 
得 输出 。 我 们 把 这 个 服务 称 为 “远程 正常 运行 时 间 ” (remote uptime) 
(简写 为 “ruptime”) ° 


#include "apue.h" 
#include «netdb.h» 
#include «errno.h» 
#include <sys/socket.h> 


#define BUFLEN 128 


extern int connect_retry(int, int, int, 
socklen_t); 


void 
print_uptime(int sockfd) 
{ 

int n; 

char buf [BUFLEN] ; 


c 


while ((n = recv(sockfd, buf, BUFLEN, 


write(STDOUT FILENO, buf, n); 
if (A < 0) 
err sys("recv error"); 


int 

main(int argc, char *argv[]) 

{ 
struct addrinfo AAI ES, aaa? 
struct addrinfo hint; 
int sockfd, err; 


if (argc != 2) 


onst struct sockaddr *, 


0)) » 0) 


err quit("usage: ruptime hostname"); 


memset(&hint, 0, sizeof(hint)); 
hint.ai socktype = SOCK STREAM; 
hint.ai canonname - NULL; 
hint.ai addr = NULL; 

hint.ai next - NULL; 


if ((err = getaddrinfo(argv[1], "ruptime", &hint, &ailist)) 


err quit("getaddrinfo error: $s", 
for (aip = ailist; aip != NULL; aip = aip-»ai next) { 


if ((sockfd = connect_retry(aip->ai_family, 


gai strerror(err)); 


aip-»ai addr, aip-»ai addrlen)) < 0) { 


err --.errio; 


) else ( 
print uptime (sockfd); 
exit(0); 


) 


err exit (err, "can't connect to £s", 


116-16 用 于 从 服务 器 


- 


IK 


argv[1]); 


取 正 常 运行 时 间 的 


Z 


!= 0) 


SOCK_STREAM, 


0, 


这 个 程序 连接 服务 器 ， 读 取 服 务 器 发 送 过 来 的 字符 串 并 将 其 打印 
到 标准 输出 。 因 为 使 用 的 是 SOCK_STREAM 套 接 字 ， 所 以 不 能 保证 调 
用 一 次 recv 就 会 读 取 整 个 字符 串 ， 因 此 需要 重复 调用 直到 它 返 回 0 。 

如 宁 服 务 需 文 持 多 重 网 络 接口 或 多 重 网 络 协 议 ， 函 数 getaddrinfo 可 
能 会 返回 多 个 候选 地 址 供 使 用 。 轮 流花 试 每 个 地 址 ， 当 找到 一 个 允许 
连接 到 服务 的 地 址 时 便 可 停止 。 使 用 图 16-11 中 的 connect_retry 范 数 来 与 
服务 器 建立 一 个 连接 。 

实例 : 面向 连接 的 服务 器 

图 16-17 展 示 了 服务 器 程序 ， 用 来 提供 uptime 命 令 的 输出 到 图 16-16 
所 示 的 客户 端 程序 。 


#include 
#include 


"apue.h" 
<netdb.h> 
<errno.h> 
«syslog.h» 
«sys/socket.h» 


#include 
#include 
#include 


#define 
#define 


BUFLEN 
QLEN 10 


128 


#ifndef 
#define 
fendif 


HOST NAME MAX 
HOST NAME MAX 256 


extern int initserver(int, 


void 


serve(int sockfd) 


( 


int erfa; 
FILE *fp; 
char buf [BUFLEN] ; 


set_cloexec (sockfd) ; 


for (77) { 


const struct sockaddr *, 


Socklen t, 


if ((clfd = accept(sockfd, NULL, NULL)) « 0) { 


Syslog(LOG ERR, "ruptimed: accept error: $s", 
strerror(errno)); 

exit(1); 

} 

set cloexec(clfd); 

if ((fp = popen("/usr/bin/uptime", "r")) == NULL) { 
sprintf(buf, "error: %s\n", strerror(errno)); 
send(clfd, buf, strlen(buf), 0); 

) else { 
while (fgets(buf, BUFLEN, fp) !- NULL) 

send(clfd, buf, strlen(buf), 0); 


pclose (fp); 
} 
close(clfd); 


int 
main(int argc, 


{ 


char *argv[]) 


struct addrinfo *ailist, 


*aip; 


int); 


struct addrinfo hint; 


int sockfd, err, n; 
char "host 
if (argc != 1) 


err quit("usage: ruptimed"); 
if ((n = sysconf( SC HOST NAME MAX)) « 0) 
n = HOST NAME MAX; /* best guess */ 
if ((host = malloc(n)) == NULL) 
err sys("malloc error"); 
if (gethostname (host, n) < 0) 
err sys("gethostname error"); 
daemonize ("ruptimed"); 
memset (&hint, 0, sizeof(hint)); 
hint.ai_flags = AI_CANONNAME; 
hint.ai_socktype = SOCK_STREAM; 
hint.ai_canonname = NULL; 
hint.ai_addr = NULL; 
hint.ai next = NULL; 
if ((err = getaddrinfo(host, "ruptime", &hint, &ailist)) != 0) { 
syslog(LOG_ERR, "ruptimed: getaddrinfo error: %s", 
gai strerror(err)); 
exit(1); 
) 
for (aip = ailist; aip != NULL; aip = aip-»ai next) { 
if ((sockfd = initserver(SOCK STREAM, aip-»ai addr, 
aip-»ai addrlen, QLEN)) >= 0) { 
serve (sockfd) ; 
exit(0); 


exit (1); 


图 16-17 提供 系统 正常 运行 时 间 的 服务 器 程序 

为 了 找到 它 的 地 址 ， 服 务 器 需要 获得 其 运行 时 的 主机 名 。 如 果 主 
机 名 的 最 大 长 度 不 确定 ， 可 以 使 用 HOST_ NAME_MAX 代 替 。 如 果 系 
统 没 定义 HOST _ NAME_MAX， 可 以 目 己 定义 。POSIX.1 要 求 主 机 名 的 
RAKE BD ADF TD, 不 包括 终止 nl 字符， 因此 定义 
HOST_NAME_MAX 为 256 来 包括 终止 nul 字 符 。 

服务 器 调用 gethostname 获 得 主机 名 ， 查 看 远程 正常 运行 时 间 服 务 
的 地 址 。 可 能 会 有 多 个 地 址 返回 ， 但 我 们 简单 地 选择 第 一 个 来 建立 被 
动 套 接 字 端点 〈 即 一 个 只 用 于 监听 连接 请 求 的 地 址 ) 。 处 理 多 个 地 址 
作为 习题 留 给 读者 。 


使 用 图 16-12 的 initserver 函 数 来 初始 化 套 接 字 端 点 ， 在 这 个 端点 上 

待 到 来 的 连接 请 求 。 (实际 上 ， 使 用 的 是 图 16-22 的 版 本 ; 在 16.6 市 
M 仑 套 接 字 选 项 时 ， 可 以 了 解 其 中 的 原因 。 ) 

实例 另 一 个 面向 连接 的 服务 器 

前 面 说 过 ， 采 用 文件 描述 符 来 访问 套 接 字 是 非常 有 意义 的 ， 因 为 
它 允 许 程序 对 联网 环境 的 网 络 访问 一 无 所 知 。 图 16-18 中 所 示 的 服务 器 
程序 版 本 说 明了 这 一 点 。 服 务 器 没有 从 uptime 命 令 中 读 取 输出 并 发 送 到 
客户 端 ， 命令 的 标准 输出 和 标准 错误 安排 成 为 连接 到 客户 
端的 套 接 字 端点 


#include 
#include 
#include 


"apue.h" 

<netdb.h> 
<errno.h> 
#include 
#include 
#include 
#include 


<syslog.h> 
«fcntl.h» 
«sys/socket.h» 
<sys/wait.h> 


#define QLEN 10 


#ifndef HOST_NAME MAX 
#define HOST NAME MAX 256 
#fendif 


extern int initserver(int, 


void 
serve (int sockfd) 
{ 
int 
pid t 


clfd, 
pid; 


status; 


set_cloexec (sockfd) ; 


for (77) { 


if ((clfd = accept (sockfd, NULL, 
"ruptimed: 


Syslog(LOG ERR, 
strerror (errno)); 
exit(1); 
} 
if ((pid = fork()) < 0) { 
syslog (LOG_ERR, 
strerror (errno)); 
exit(1); 
) else if (pid == 0) 
/* 


* The parent called daemonize (Figure 13.1), 
STDOUT_FILENO, 
* are already open to /dev/null. 


* STDIN_FILENO, 


const struct sockaddr *, 


"ruptimed: fork error: 


socklen_t, int); 


NULL)) < 0) { 


accept error: %s", 


Ss", 


{ /* child */ 


so 
and STDERR_FILENO 
Thus, the call to 


* close doesn't need to be protected by checks that 


* clfd isn't already equal to one of these values. 


*/ 
if (dup2(clfd, 
syslog (LOG_ERR, 
exit(1); 
} 
close(clfd); 
execl ("/usr/bin/uptime", 
syslog (LOG_ERR, 
strerror(errno)); 
) else { /* parent */ 
close (clfd); 
waitpid (pid, 


&status, 0); 


STDOUT FILENO) 
dup2(clfd, STDERR FILENO) 
"ruptimed: unexpected error"); 


"uptime", 
"ruptimed: 


!= STDOUT FILENO || 
!- STDERR FILENO) { 


(chaz *y0); 
unexpected return from exec: 


Ss. 


int 
main(int argc, char *argv[]) 


{ 


struct addrinfo *arlist; *aip; 
struct addrinfo hint; 

int sockfd, err, n; 
char *hosts 

if (argc != 1) 


err quit("usage: ruptimed"); 


if ((n = sysconf( SC HOST NAME MAX)) « 0) 
n = HOST NAME MAX; /* best guess */ 
if ((host = malloc(n)) == NULL) 
err sys("malloc error"); 
if (gethostname (host, n) < 0) 


err sys("gethostname error"); 
daemonize ("ruptimed"); 
memset(&hint, 0, sizeof(hint)); 
hint.ai flags = AI CANONNAME; 
hint. SOCK STREAM; 
hint. NULL; 
hint. 
hint. 
if 


ai socktype 


ai canonname 

NULL; 

NULL; 

((err getaddrinfo (host, 

syslog (LOG_ERR, 
gai strerror(err)); 

exit (1); 


ai addr 


ai next 


"ruptime", &hint, &ailist)) 


"ruptimed: getaddrinfo error: $s", 


} 
for 


(aip ailist; aip != NULL; aip aip->ai_next) { 
if ((sockfd initserver(SOCK STREAM, aip->ai_addr, 


aip->ai_addrlen, QLEN)) >= 0) { 


serve (sockfd) ; 
exit (0); 


exit : 


0) { 


用 于 说 明 命 令 直 接 写 到 套 接 字 的 服务 


图 16-18 


我 们 没有 采用 popen 来 运行 uptime 命 令 ， 并 从 连接 到 命令 
的 管道 读 取 输出 ， 而 是 采用 fork 创 建 了 一 个 子 进程 


器 程序 


标准 输出 
然后 使 用 dup2 使 


STDIN_FILENO 的 子 进程 副本 对 /dev/null 开 放 ， 使 STDOUT_FILENO 和 


wr HH 


STDERR FILENO 的 子 进程 副本 对 套 授 字 端 点 


开放 。 当 执行 uptime 


时 ， 命 令 将 结果 写 到 和 它 的 标准 输出 ， 该 标准 输出 是 连接 到 套 接 字 的 ， 
所 以 数据 被 送 到 ruptime 客 户 端 命令 。 

父 进程 可 以 安全 地 关闭 连接 到 客户 端的 文件 朱 述 符 ， 因 为 子 进程 
仍旧 让 它 打开 着 。 父 进程 会 等 待 子 进 程 处 理 完毕 再 继续 ， 所 以 子 进 程 
不 会 变 成 僵 死 进程 。 由 于 运行 uptime 命 令 不 会 花费 太 长 的 时 间 ， 所 以 父 
进程 在 接受 下 一 个 连接 请 求 之 前 ， 可 以 等 竺 子 进程 退出 。 然 而 ， 如 果 
子 进 程 运 行 的 时 间 比 较 长 的 话 ， 这 种 策略 就 未 愉 适 合 了 。 

前 面 的 实例 采用 的 都 是 面 铝 连接 的 套 接 字 。 但 如 何 先 择 合适 的 套 
接 字 类 型 呢 ? 何 时 采用 面向 连 授 的 套 接 字 ， 何 时 采用 无 连接 的 套 接 字 
We? 答案 取决 于 我 们 要 做 的 工作 量 和 能 够 容忍 的 出 错 程度 。 

对 于 无 连接 的 套 接 字 ， 数 据 包 到 达 时 可 能 已 经 没有 次 序 ， 因 此 如 
果 不 能 将 所 有 的 数据 放 在 一 个 数据 包 里 ， 则 在 应 用 程序 中 就 必须 关心 
数据 包 的 次 序 。 数 据 包 的 最 大 尺寸 是 通信 协议 的 特征 。 另 外 ， 对 于 无 
连接 的 套 接 字 ， 数 据 包 可 能 会 丢失 。 如 果 应 用 程序 不 能 容忍 这 种 丢 
失 ， 必 须 使 用 面 癌 连接 的 套 接 字 。 

容忍 数据 包 丢 失意 味 着 两 种 选择 。 一 种 选择 是 ， 如 果 想 和 对 等 方 
可 徘 通信 ， 就 必须 对 数据 包 编 号 ， 并 且 在 发 现 数据 包 丢 失 时 ， 请 求 对 
等 应 用 程序 重 传 ， 还 必须 标识 重复 数据 包 并 丢弃 它们 ， 因 为 数据 包 可 
能 会 延迟 或 疑似 丢失 ， 可 能 请 求 重 传 之 后 ， 它 们 又 出 现 了 。 

男 一 种 选择 是 ， 通 过 让 用 户 再 次 等 试 那个 命令 来 处 理 错误 。 对 于 
简单 的 应 用 程序 ， 这 可 能 就 足够 了 ， 但 对 于 复杂 的 应 用 程序 ， 这 种 选 
择 通常 不 可 行 。 因 此 ， 一 般 在 这 种 情况 下 使 用 面向 连接 的 套 接 字 比 较 
好 。 

面向 连接 的 套 接 字 的 缺陷 在 于 需要 更 多 的 时 间 和 工作 来 建立 一 个 
连接 ， 并 且 每 个 连接 都 需要 消耗 较 多 的 操作 系统 资源 。 

实例 : 无 连接 的 客户 端 


图 16-19 中 的 程序 是 采用 数据 报 套 接 字 接 口 的 uptime 客 户 端 命 令 版 


#include "apue.h" 
#include <netdb.h> 
#include <errno.h> 
#include <sys/socket.h> 


#define BUFLEN 128 
#define TIMEOUT 20 
void 


sigalrm(int signo) 
{ 
} 


void 
print_uptime(int sockfd, struct addrinfo *aip) 


{ 


int n; 
char buf [BUFLEN] ; 
buf[0] = 0; 


if (sendto(sockfd, buf, 1, 0, aip-»ai addr, aip-»ai addrlen) < 0) 
err sys("sendto error"); 
alarm(TIMEOUT); 
if ((n = recvfrom(sockfd, buf, BUFLEN, 0, NULL, NULL)) « 0) { 
if (errno != EINTR) 
alarm(0); 
err sys("recv error"); 
} 
alarm(0); 
write(STDOUT FILENO, buf, n); 


) 


int 
main(int argc, char *argv[]) 


( 


struct addrinfo *allist; *aurps; 
struct addrinfo hint; 

int sockfd, err; 
struct sigaction Sa; 

if (argc != 2) 


err quit("usage: ruptime hostname"); 

sa.sa handler = sigalrm; 

sa.sa flags = 0; 

sigemptyset(&sa.sa mask); 

if (sigaction(SIGALRM, &sa, NULL) « 0) 
err sys("sigaction error"); 

memset(&hint, 0, sizeof(hint)); 

hint.ai socktype = SOCK DGRAM; 

hint.ai canonname - NULL; 

hint.ai addr = NULL; 

hint.ai next = NULL; 

if ((err = getaddrinfo(argv[1], "ruptime", &hint, &ailist)) != 0) 
err quit("getaddrinfo error: $s", gai strerror(err)); 


for (aip = ailist; aip != NULL; aip = aip->ai next) { 
if ((sockfd = socket(aip-»ai family, SOCK DGRAM, 0)) < 0) { 
err = errno; 
} else { 


print_uptime(sockfd, aip); 
exit (0); 


} 


fprintf(stderr, "can't contact %s: s\n", argv[1], strerror(err)); 
exit(1); 


图 16-19 采用 数据 报 服务 的 客户 端 命令 


除了 增加 安装 一 个 SIGALRM 的 信号 处 理 程序 以 外 ， 基 于 数据 报 的 
客户 端 中 的 main 画 数 和 面向 连接 的 客户 问 中 的 类 似 。 使 用 alarm 函 数 来 
避免 调用 recvfrom 时 的 无 限期 阻塞 。 

对 于 面向 连接 的 协议 ， 需 要 在 交换 数据 之 前 连接 到 服务 器 。 对 于 
服务 器 来 说 ， 到 来 的 连接 请 求 已 经 足够 判断 出 所 需 提供 给 客户 端的 服 
务 。 但 是 对 于 基于 数据 报 的 协议 ， 需 要 有 一 种 方法 通知 服务 器 来 执行 
服务 。 本 例 中 ， 只 是 简单 地 疝 服务 器 发 送 了 1 字 市 的 数据 。 服 务 器 将 


接收 它 ， 从 数据 包 中 得 到 地 址 ， 并 使 用 这 个 地 址 来 传送 它 的 啊 应 。 如 
果 服 务 器 提供 多 个 服务 ， 可 以 使 用 这 个 请 求 数据 来 表示 需要 的 服务 ， 
但 由 于 服务 器 只 做 一 件 事情 ，1 字 节 数 据 的 内 容 是 无 关 紧 要 的 。 

如 琳 服 务 右 不 在 运行 状态 ， 客 户 端 调用 recvfrom 便 会 无 限期 阻塞 。 
对 于 这 个 面 癌 连接 的 实例 ， 如 果 服 务 亏 不 运行 ，connect 调用 会 失败 。 
为 了 避免 无 限期 阻塞 ， 可 以 在 调用 recvfrom 之 前 设置 警告 时 钟 。 

实例 : 无 连接 的 服务 器 

图 16-20 所 示 的 程序 是 uptime 服 务 器 的 数据 报 版 本 。 


#include 
#include 
#include 
#include 
#include 


#define 


"apue.h" 
<netdb.h> 
<errno.h> 
<syslog.h> 
<sys/socket.h> 


BUFLEN 128 


#define MAXADDRLEN 256 


#ifndef HOST_NAME MAX 
#define HOST_NAME MAX 256 
#fendif 
extern int initserver(int, const struct sockaddr *, socklen t, int); 
void 
serve(int sockfd) 
{ 
int n; 
socklen t alen; 
FILE fs 
char buf [BUFLEN] ; 
char abuf [MAXADDRLEN] ; 
struct sockaddr *addr = (struct sockaddr *) abuf; 


set cloexec(sockfd); 


for 


int 


(ar) ( 

alen - MAXADDRLEN; 

if ((n = recvfrom(sockfd, buf, BUFLEN, 0, addr, &alen)) < 0) 
Syslog(LOG ERR, "ruptimed: recvfrom error: $s", 

strerror(errno)); 

exit(1); 

} 

if ((fp = popen("/usr/bin/uptime", "r")) == NULL) { 
sprintf (buf, "error: %s\n", strerror(errno)); 
sendto(sockfd, buf, strlen(buf), 0, addr, alen); 

} else { 
if (fgets(buf, BUFLEN, fp) != NULL) 

sendto(sockfd, buf, strlen(buf), 0, addr, alen); 

pclose (fp); 


main(int argc, char *argv[]) 


{ 


struct addrinfo *ailist, *aip; 
struct addrinfo hint; 


int 


sockfd, err, n; 


{ 


char *host; 


if (argc != 1) 
err quit("usage: ruptimed"); 
if ((n = sysconf( SC HOST NAME MAX)) « 0) 
n = HOST NAME MAX; /* best guess */ 
if ((host = malloc(n)) == NULL) 
err sys("malloc error"); 
if (gethostname(host, n) « 0) 
err sys("gethostname error"); 
daemonize ("ruptimed") ; 
memset (&hint, 0, sizeof(hint)); 
hint.ai_flags = AI_CANONNAME; 
hint.ai_socktype = SOCK_DGRAM; 
hint.ai_canonname = NULL; 
hint.ai_addr = NULL; 
hint.ai_next = NULL; 
if ((err = getaddrinfo(host, "ruptime", &hint, &ailist)) != 0) { 
syslog(LOG_ERR, "ruptimed: getaddrinfo error: %s", 
gai strerror (err) ); 
exit (1); 
} 
for (aip = ailist; aip != NULL; aip = aip->ai_next) { 
if ((sockfd = initserver(SOCK DGRAM, aip->ai_addr, 
aip->ai_addrlen, 0)) >= 0) { 
serve (sockfd) ; 
exit (0); 


exit(1); 


116-20 基于 数据 报 提供 系统 正常 运行 时 间 的 服务 器 

服务 器 在 recvfrom 阻 塞 等 待 服务 请 求 。 当 一 个 请 求 到 达 时 ,保存 请 
求 者 地 址 并 使 用 popen 来 运行 uptime 命 令 。 使 用 sendto 函 数 将 输出 发 送 到 
客户 端 ， 将 目标 地 址 设置 成 刚才 的 请 求 者 地 址 。 


T 


16.6 选项 


套 接 字 机 制 提 供 了 两 个 套 接 字 选 项 接口 来 控制 套 接 字 行为 。 一 个 
接口 用 来 设置 选项 ， 另 一 个 接口 可 以 查询 选项 的 状态 。 可 以 获取 或 设 
置 以 下 3 种 选项 。 


(1) 通用 选项 ， 工 作 在 所 有 套 接 字 类 型 上 。 
(2) 在 套 接 字 层 次 管理 的 选项 ， 但 是 依赖 于 下 层 协议 的 文 持 。 
(3) 特定 于 某 协议 的 选项 ， 每 个 协议 独 有 的 。 
Single UNIX Specification 定 义 了 套 接 字 层 的 选项 《上述 选 项 中 的 前 
两 个 选项 类 型 ) 。 
可 以 使 用 setsockopt 函 数 来 设置 套 接 字 选 项 
#include <sys/socket.h> 
int setsockopt(int sockfd, int level, int option, const void *val, 
socklen t len); 
返回 值 : AH, Reo; AES, we- 
参数 level 标识 了 选项 应 用 的 协议 。 如 果 选 项 是 通用 的 套 接 字 层次 
选项 ， 则 level 设置 成 SOL_SOCKET 。 和 否则 ，level 设 置 成 控制 这 个 选项 
的 协议 编号 。 对 于 TCP 选 项 ，level 是 IPPROTO_TCP， 对 于 卫 ，level 是 
IPPROTO IP » 图 16.21 总 结 了 Single UNIX Specification 中 定义 的 通用 套 
接 字 层次 选项 。 


参数 val 的 类 型 


SO ACCEPTCONN i 返回 信息 指示 该 套 接 字 是 否 能 被 监听 ( 仅 getsockopt) 
SO_BROADCAST i 如 果 *val 非 0， 广 播 数据 报 

SO DEBUG i 如 果 *val 非 0， 启 用 网 络 驱动 调试 功能 
SO_DONTROUTE i 如 果 *val 非 0， 绕 过 通常 路 由 

SO_ERROR i 返回 挂 起 的 套 接 字 错 误 并 清除 XX getsockopt) 
SO KEEPALIVE i 如 果 *val 非 0， 局 用 周期 性 keep-alive 报 文 
SO_LINGER i 当 还 有 未 发 报 文 而 套 接 字 已 关闭 时 ， 延 迟 时 间 

SO OOBINLINE i 如 果 *val 非 0， 将 带 外 数据 放 在 普通 数据 中 

SO RCVBUF i 接收 缓冲 区 的 字 节 长 度 

SO_RCVLOWAT i 接收 调用 中 返回 的 最 小 数据 字 节 数 

SO_RCVTIMEO i 套 接 字 接 收 调用 的 超时 值 

SO_REUSEADDR i 如 果 *val 非 0， 重 用 bind 中 的 地 址 
SO_SNDBUF i 发 送 缓冲 区 的 字 节 长 度 

SO SNDLOWAT i 发 送 调用 中 传送 的 最 小 数据 字 节 数 
SO_SNDTIMEO struct timeval | 套 接 字 发 送 调用 的 超时 值 

SO_TYPE int 标识 套 接 字 类 型 〈 仅 getsockopt) 


图 16-21 套 接 字 选 项 


参数 val 和 根据 选 项 的 不 同 指 同一 个 数据 结构 或 者 一 个 整数 。 一 些 ; 
项 是 on/off 开 天 。 如 果 整 数 非 0， 则 局 用 选项 。 如 末 整 数 为 0， 则 至 十 i 
项 。 参 数 len 指 定 了 val 指 向 的 对 象 的 大 小 。 

可 以 使 用 getsockopt 芳 数 来 查看 克 项 的 当前 值 。 


#include <sys/socket.h> 


(5 


ES: 


int getsockopt(int sockfd, int level, int option, void *restrict val, 
socklen t *restrict lenp); 
返回 值 : Ak, allo; AE, we- 

参数 lenp 是 一 个 指向 整数 的 指针 。 在 调用 getsockopt 之 前 ， 设 置 该 
整数 为 复制 选项 缓冲 区 的 长 度 。 如 果 选 项 的 实际 长 度 大 于 此 值 ， 则 选 
项 会 被 截断 。 如 果实 际 长 度 正好 小 于 此 值 ， 那 么 返回 时 将 此 值 更 新 为 
实际 长 度 。 

实例 

当 服 务 器 终止 并 尝试 立即 重启 时 ， 图 16-12 中 的 函数 将 无 法 正常 工 
作 。 通 常情 况 下 ， 除 非 超时 (超时 时 间 一 般 是 几 分 钟 ，， 否 则 TCP 的 实 
SUP FRE SBE RI— T AU ° SIGN ze, CBE XO REUSEADDRH] 
以 绕 过 这 个 限制 ， 如 图 16-22 所 示 。 


#include "apue.h" 
#include <errno.h> 
#include <sys/socket.h> 


int 


initserver(int type, const struct sockaddr *addr, socklen t alen, 


int qlen) 
{ 
int fd, err; 
int reuse - 1; 


if ((fd = socket(addr-»5sa family, type, 0)) < 0) 
return(-1); 
if (setsockopt(fd, SOL SOCKET, SO REUSEADDR, &reuse, 
sizeof(int)) « 0) 
goto errout; 
if (bind(fd, addr, alen) < 0) 
goto errout; 
if (type == SOCK_STREAM || type == SOCK_SEQPACKET) 
if (listen(fd, qlen) < 0) 
goto errout; 
return (fd); 


errout: 
err = errno; 
close (fd); 
errno = err; 
return(-1); 


图 16-22 采用 地 址 复 用 初始 化 套 接 字 端 点 供 服务 器 使 用 

为 了 局 用 SO_REUSEADDR 选 项 ， 设 置 了 一 个 非 0 值 的 整数 ， 并 把 
这 个 整数 地 址 作为 val 参 数 传递 给 了 setsockopt。 将 len 参 数 设置 成 了 一 个 
整数 大 小 来 表明 val 所 指 的 对 象 的 大 小 。 


16.7 FY 


带 外 数据 (out-of-band data) 是 一 些 通 信 协 议 所 文 持 的 可 选 功 能 ， 
与 普通 数据 相 比 ， 它 允许 更 高 优先 级 的 数据 传输 。 带 外 数据 先行 传 
输 ， 即 使 传输 队列 已 经 有 数据 。TCP 支持 带 外 数据 ， 但 是 UDP 不 支 
持 。 套 接 字 接口 对 带 外 数据 的 支持 很 大 程度 上 受 TCP 带 外 数据 具体 实现 
的 影响 。 

TCP 将 带 外 数据 称 为 紧急 数据 (urgent data) 。TCP 仪 支持 一 个 字 
廊 的 紧急 数据 ,但 是 允许 紧急 数据 在 普通 数据 传递 机 制 数据 流 之 外 传 


输 。 为 了 产生 紧急 数据 ， 可 以 在 3 个 send 画 数 中 的 任何 一 个 里 指定 
MSG_OOB 标 志 。 如果 带 MSG_OOB 标 志 发 送 的 字 市 数 超过 一 个 时 ， 最 
后 一 个 字 地 将 被 视 为 紧急 数据 字 广 。 

如 果 通 过 套 接 字 安 排 了 信号 的 产生 ， 那 么 紧急 数据 被 接收 时 ， 会 
发 送 SIGURG 信 号 。 在 3.14 节 和 14.5.2 节 中 可 以 看 到 ， 在 fcnd 中 使 用 
F_SETOWN 命 令 来 设置 一 个 套 搂 字 的 所 有 权 。 如 采 fcnt 中 的 第 三 个 参 
数 为 正 值 ， 那 么 它 指 定 的 就 是 进程 ID。 如 有 果 为 非 -1 的 负 值 ， 那 么 它 代 
表 的 就 是 进程 组 DD。 因 此 ， 可 以 通过 调用 以 下 画 数 安排 进程 接收 套 接 
字 的 信号 : 

fcntl(sockfd, F SETOWN, pid); 

F GETOWN 命令 可 以 用 来 获得 当前 套 接 字 所 有 权 。 对 于 
F_SETOWN 命 令 ， 负 值 代 表 进 程 组 ID， 正 值 代表 进程 ID。 因 此 ， 调 用 

owner = fcntl(sockfd, F GETOWN, 0); 

将 返回 owner， 如 果 owner 为 正 值 ， 则 等 于 配置 为 接收 套 接 字 信 和 号 
的 进程 的 ID。 如 果 owner 为 负 值 ， 其 绝对 值 为 接收 套 接 字 信 和 号 的 进程 组 
的 ID。 

TCP 支 持 紧 急 标 记 (urgent mark) 的 概念 ， 即 在 普通 数据 流 中 紧急 
数据 所 在 的 位 置 。 如 采 采 用 套 接 字 选 项 SO_OOBINLINE， 那 么 可 以 在 
普通 数据 中 接收 紧急 数据 。 为 帮助 判断 是 否 已 经 到 达 紧 急 标 记 ， 可 以 
使 用 函数 sockatmark ° 


#include <sys/socket.h> 


int sockatmark(int sockfd); 
返回 值 : 者 在 标记 处 ， 返 回 1; 者 没 在 标记 处 ， 返 回 0; 大 出 钳 ， 返 回 
-1 


SRP EIS FE A eae ST, sockatmarkok [H1 ° 
“SMH HB LEE EIT, selecti (0114.4.177) 会 
返回 一 个 文件 描述 符 并 且 有 一 个 待 处 理 的 异常 条 件 。 可 以 在 普通 数据 
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在 其 他 队列 数据 之 前 接收 紧急 数据 。TCP 队 列 仅 用 一 个 字 节 的 紧急 数 
据 。 如 果 在 接收 当前 的 紧急 数据 字 忆 之 前 又 有 新 的 紧急 数据 到 来 ， 那 
么 已 有 的 字 节 会 被 丢弃 。 


16.8 非 阳 塞 和 异步 VO 


通常 ，recv 函数 没有 数据 可 用 时 会 阻塞 等 待 。 同 样 地 ， 当 套 接 字 
输出 队列 没有 足够 空间 来 发 送 消息 时 ，send 画 数 会 阻塞 。 在 套 接 字 非 
阻塞 模式 下 ， 行 为 会 改变 。 在 这 种 情况 下 ， 这 些 函 数 不 会 阻塞 而 是 会 
失败 ， 将 errno 设 置 为 EWOULDBLOCK 或 者 EAGAIN。 当 这 种 情况 发 生 
时 ， 可 以 使 用 pol] 或 select 来 判断 能 否 接收 或 者 传输 数据 。 

Single UNIX Specification 包 含 通 用 异步 IO 机制 (3114.57) 的 文 
持 。 套 接 字 机 制 有 其 自己 的 处 理 异 步 WO 的 方式 ， 但 是 这 在 Single UNIX 
Specification 中 没有 标准 化 。 一 些 文 献 把 经 典 的 基于 套 接 字 的 异步 WO 机 
制 称 为 “基于 信和 号 的 VO”， 区 别 于 Single UNIX Specification 中 的 通用 异 
步 VO 机 制 。 

在 基于 套 接 字 的 异步 /0 中 ， 当 从 套 接 字 中 读 取 数据 时 ， 或 者 当 套 
接 字 写 队 列 中 空间 变 得 可 用 时 ， 可 以 安排 要 发 送 的 信号 SIGIO。 启 用 异 
步 IO 是 一 个 两 步 又 的 过 程 。 

(1) 建立 套 接 字 所 有 权 ， 这 样 信号 可 以 被 传递 到 合适 的 进程 。 
(2) 通知 套 接 字 当 IMO 操 作 不 会 阻塞 时 发 信号 。 
可 以 使 用 3 种 方式 来 完成 第 一 个 步骤 。 
(1) 在 fcntl 中 使 用 F_SETOWN 命 令 。 
(2) 在 ioctl 中 使 用 FIOSETOWN 命 令 。 
(3) 在 ioctl 中 使 用 SIOCSPGRP 命 令 。 


要 完成 第 二 个 步骤， 有 两 个 选择 。 
(1) 在 fcntl 中 使 用 F_SETFL 命 令 并 且 启 用 文件 标志 O_ASYNC 。 
(2) 在 ioctl 中 使 用 FIOASYNC 命 令 。 
虽然 有 多 种 选项 ， 但 它们 没有 得 到 普遍 支持 。 图 16-23 总 结 了 本 文 
讨论 的 平台 支持 这 些 选 项 的 情况 。 


R FreeB , Mac OS X Solaris 
机 制 | POSIX.1 | gpg | Linux 3.2.0 10.6.8 


fcntl(fd, F SETFL, flags|O ASYNC) 
ioctl(fd, FIOASYNC, &n); 


fcntl(fd, F SETOWN, pid) 
ioctl(fd, FIOSETOWN, pid) 
ioctl(fd, SIOCSPGRP, pid) 


图 16-23 套 接 字 异步 /O 管 理 命令 


16.9 小 结 


本 章 考察 了 IPC 机 制 ， 这 些 机 制 允 许 进 程 与 不 同 计算 机 上 的 以 及 同 
一 计算 机 上 的 其 他 进程 通信 。 我 们 讨论 了 套 接 字 端 点 如 何 命名 ， 在 连 
接 服 务 右 上 时， 如何 发 现 所 用 的 地 址 。 

我 们 给 出 了 采用 无 连接 的 ( 即 基 于 数据 报 的 ) 套 接 字 和 面向 连接 
的 套 接 字 的 客户 逆 和 服务 此 的 实例 ， 还 位 要 讨论 了 异步 和 非 阻塞 的 套 
接 字 WO， 以 及 用 于 管理 套 接 字 选 项 的 接口 。 

下 一 半 将 会 考察 一 些 高 级 IPC 主 题 ， 包 括 在 同一 台 计 算 机 上 如 何 使 
用 套 接 字 在 两 个 进程 之 间 传 送 文件 描述 符 。 


习题 


16.1 写 一 个 程序 判断 所 使 用 系统 的 字 节 序 。 

16.2 写 一 个 程序 ， 在 至 少 两 种 不 同 的 平台 上 打印 出 所 文 持 套 接 字 
的 stat 结构 成 员 ， 并 且 描 述 这 些 结果 的 不 同 之 处 。 

16.3 图 16-17 的 程序 只 在 一 个 端点 上 提供 了 服务 。 修 改 这 个 程序 ， 
同时 支持 多 个 端点 (每 个 端点 具有 一 个 不 同 的 地 址 ) 上 的 服务 。 

16.4 写 一 个 客户 端 程序 和 服务 端 程序 ， 返 回 指定 主机 上 当前 运行 
的 进程 数量 。 

16.5 在 图 16-18 的 程序 中 ， 服 务 絮 等待 子 进程 执行 uptime， 子 进程 
完成 后 退出 ， 服 务 器 才 接 受 下 一 个 连接 请 求 。 重 新 设计 服务 器 ， 使 得 
处 理 一 个 请 求 时 并 不 拖延 处 理 到 来 的 连接 请 求 。 

16.6 写 两 个 库 例 程 : 一 个 在 套 接 字 上 人 允许 异步 JO， 一 个 在 套 接 字 
上 不 允许 异步 JO。 使 用 图 16-23 来 保证 函数 能 够 在 所 有 平台 上 运行 ， 并 
且 文 持 尽 可 能 多 的 套 接 字 类 型 。 


173€ 高 级 进程 间 通 信 


17.1 引言 


前 面 两 章 讨论 了 UNIX 系统 提供 的 各 种 IPC， 其 中 包括 管道 和 套 接 
字 。 本 章 介绍 一 种 高 级 IPC-- -UNIX 域 套 接 字 机 制 ， 并 说 明 它 的 应 用 方 
法 。 这 种 形式 的 IPC 可 以 在 同一 计算 机 系统 上 运行 的 两 个 进程 之 间 传 送 
打开 文件 描述 符 。 服 务 进 程 可 以 使 它们 的 打开 文件 描述 符 与 指定 的 名 
字 相 关联 ， 同 一 系统 上 运行 的 客户 进程 可 以 使 用 这 些 名 字 与 服务 露 进 
程 汇聚 。 我 们 还 会 了 解 到 操作 系统 如 何 为 每 一 个 客户 进程 提供 一 个 独 
用 的 IPC 通 道 。 


17.2 UNIX 域 套 接 字 


UNIX 域 套 接 字 用 于 在 同一 台 计 算 机 上 运行 的 进程 之 间 的 通信 。 虽 
然 因 特 网 域 套 接 字 可 用 于 同一 目的 ， 但 UNIX 域 套 接 字 的 效率 更 高 。 
UNIX 域 套 接 字 仅 仅 复制 数据 ， 它 们 并 不 执行 协议 处 理 ， 不 需要 添加 或 
删除 网 络 报头 ， 无 需 计算 校 验 和 ， 不 要 产生 顺序 号 ， 无 需 发 送 确认 报 
UNIX 域 套 接 字 提供 流 和 数据 报 两 种 接口 。UNIX 域 数据 报 服务 是 
可 靠 的 ， 既 不 会 丢失 报 文 也 不 会 传递 出 销 。UNIX WERT RACER 


字 和 管道 的 混合 。 可 以 使 用 它们 面向 网 络 的 域 套 授 字 接口 或 者 使 用 
socketpair 函 数 来 创建 一 对 无 命名 的 、 相 互 连 接 的 UNIX 域 套 接 字 。 

#include <sys/socket.h> 

int socketpair(int domain, int type, int protocol, int sockfd[2]); 

返回 值 : 者 成 功 ， 返 回 0; AE, wel- 

虽然 接口 足够 通用 ， 人 允许 socketpair 用 于 其 他 域 ， 但 一 般 来 说 操作 
系统 仅 对 UNIX 域 提供 支持 。 

一 对 相互 连接 的 UNIX 域 侠 授 字 可 以 起 到 全 双 工 管道 的 作用 : 两 端 
对 读 和 写 开 放 〈 见 图 17-1) 。 我 们 将 其 称 为 fd 管道 (fd-pipe) ， 以 便 
与 普通 的 半 双 工 管道 区 分 开 来 。 


用 户 进程 


£d[0] 


£d[1] 


图 17-1 BRE HT 

实例 : fd pipeEk2A 

图 17-2 展 示 了 fd_pipe 函 数 ， 它 使 用 socketpair 函 数 来 创建 一 对 相互 
连接 的 UNIX 域 流 套 接 字 ° 


#include "apue.h" 
#include <sys/socket.h> 


/* 
* Returns a full-duplex pipe (a UNIX domain socket) with 
* the two file descriptors returned in fd[0] and fd[1]. 
Hf 
int 
fd_pipe(int fd[2]) 
{ 
return(socketpair(AF UNIX, SOCK STREAM, 0, fd)); 
} 


图 17-2 创建 一 个 全 双 工 管道 


某 些 基于 BSD 的 系统 使 用 UNIX 域 套 接 字 来 实现 管道 。 但 当 调 用 
pipe 时 ， 第 一 描述 符 的 写 端 和 第 二 描述 符 的 读 端 都 是 关闭 的 。 为 了 得 到 
全 双 工 管道 ， 必 须 直 接 调 用 socketpair ° 

实例 : 借助 UNIX 域 套 接 字 轮 询 XSI 消 息 队 列 

15.6.4 市 曾经 提 到 XSI 消 息 队 列 的 使 用 存在 一 个 问题 ， 即 不 能 将 它 
们 和 poll 或 者 select 一 起 使 用 ， 这 是 因为 它们 不 能 关联 到 文件 描述 符 。 然 
而 ， 套 接 字 是 和 文件 描述 符 相 关联 的 ， 消 息 到 达 时 ， 可 以 用 套 接 字 来 
通知 。 对 每 个 消息 队列 使 用 一 个 线程 。 每 个 线程 都 会 在 msgrcv 调 用 中 
阻塞 。 当 消息 到 达 时 ， 线 程 会 把 它 写 入 一 个 UNIX 域 套 接 字 的 一 端 。 当 
poll 指 示 套 接 字 可 以 读 取 数据 时 ， 应 用 程序 会 使 用 这 个 套 接 字 的 另外 一 
端 来 接收 这 个 消息 。 

图 17-3 中 的 程序 说 明了 这 个 技术 。main 函 数 中 创建 了 一 些 消息 队列 
和 UNIX 域 套 接 字 ， 并 为 每 个 消息 队列 开局 了 一 个 新 线程 。 然 后 它 在 一 
个 无 限 循环 中 用 poll 来 轮 询 选择 一 个 套 接 字 端 点 。 当 某 个 套 接 字 可 读 
时 ， 程 序 可 以 从 套 接 字 中 读 取 数 据 并 把 消息 打印 到 标准 输出 上 。 


#include "apue.h" 
#include <poll.h> 
#include <pthread.h> 
#include <sys/msg.h> 
#include «sys/socket.h» 


#define NQ 3 /* number of queues */ 
#define MAXMSZ 512 /* maximum message size */ 
#define KEY 0x123 /* key for first message queue */ 


struct threadinfo { 
int qid; 
int fd; 

} 


struct mymesg { 

long mtype; 

char mtext[MAXMSZ]; 
he 


void * 

helper (void *arg) 

{ 
int n; 
struct mymesg m; 


struct threadinfo *tip - arg; 


for(;;) { 


memset(&m, 0, sizeof(m)); 


if ((n = msgrcv(tip-»qid, &m, MAXMSZ, 0, MSG NOERROR)) < 0) 


err sys("msgrcv error"); 
if (write(tip->fd, m.mtext, n) < 0) 
err sys("write error"); 


int i, n, err; 
int Etd[2]; 
int qid[NQ]; 
struct pollfd pfd[NQ]; 
struct threadinfo ti[NQ]; 
pthread t tid[NQ]; 
char buf[MAXMSZ]; 
for (i = 0; i < NO; i++) ( 
if ((qid[i] = msgget((KEY+i), IPC CREAT|0666)) « 0) 
err_sys("msgget error"); 
printf("queue ID £d is %d\n", i, qid[i]); 
if (socketpair(AF UNIX, SOCK DGRAM, 0, fd) « 0) 
err sys("socketpair error"); 
pfd[i].fd = fd[0]; 
pfd[i].events = POLLIN; 
t3 [3]lsgqid = gidri] 
ti[i].fd = Fai] 
if ((err = pthread create(&tid[i], NULL, helper, &ti[i])) 
err exit(err, "pthread create error"); 
} 
for (7) 1 
if (poll(pfd, NQ, -1) < 0) 
err sys("poll error"); 
for (i = 07 i < MNOS itt) { 
if (pfd[i].revents & POLLIN) { 
if ((n = read(pfd[i].fd, buf, sizeof(buf))) < 0) 
err sys("read error"); 
buf[n] = 0; 
printf ("queue id %d, message %s\n", qid[i], buf); 
} 
} 
} 
exit (0); 


图 17-3 使 用 UNIX 域 套 接 字 轮 询 XSI 消 息 队列 


0) 


注意 ， 我 们 使 用 的 是 数据 报 (SOCK DGRAM) 套 接 字 而 不 是 流 
套 接 字 。 这 样 做 可 以 保持 消 恩 边界， 以 保证 从 套 接 字 里 一 次 只 读 取 一 
条 消息 。 

这 种 技术 可 以 ( 非 直 接地 ) 在 消息 队列 中 运用 poll 或 者 select。 只 
为 每 个 队列 分 配 一 个 线程 的 开销 以 及 每 个 消息 额外 复制 两 次 (一 次 写 
入 套 接 字 ， 男 一 次 从 套 接 字 里 读 取 出 来 ) 的 开销 是 可 接受 的 ， 这 种 技 
术 束 会 使 XSI 消 息 队 列 的 使 用 更 加 容易 。 

使 用 图 17-4 中 所 示 的 程序 给 图 17-3 中 所 示 的 测试 程序 发 送 消 息 。 


#include "apue.h" 
#include <sys/msg.h> 


#define MAXMSZ 512 


struct mymesg { 

long mtype; 

char mtext [MAXMSZ]; 
bi 


int 
main(int argc, char *argv[]) 
{ 

key_t key; 

long qid; 

size_t nbytes; 

struct mymesg m; 


if (argc != 3) { 
fprintf(stderr, "usage: sendmsg KEY message\n") ; 
exit (1); 
} 
key = strtol(argv[1], NULL, 0); 
if ((gid = msgget(key, 0)) < 0) 
err sys("can't open queue key $s", argv[1]); 
memset(&m, 0, sizeof(m)); 
strncpy(m.mtext, argv[2], MAXMSZ-1); 
nbytes - strlen(m.mtext); 
m.mtype = 1; 
if (msgsnd(qid, &m, nbytes, 0) « 0) 
err sys("can't send message"); 
exit(0); 


图 17-4 给 XSI 消 息 队 列 发 送 消息 


这 个 程序 需要 两 个 参数 : 消息 队列 关联 的 键 值 以 及 一 个 包含 消息 
主体 的 字符 串 。 发 送 消息 到 服务 器 端 时 ， 它 会 打印 如 下 信息 : 

$ ./pollmsg & 在 后 台 运 行 服务 
&&[1] 12814 

$ queue ID 0 is 196608 

queue ID 1 is 196609 

queue ID 2 is 196610 


$ /sendmsg 0x123 "hello, world" 给 第 一 个 队列 发 送 一 
AH fal 

queue id 196608, message hello, world 

$ /sendmsg 0x124 "just a test" 给 第 二 个 队列 发 送 一 条 
1H And 

queue id 196609, message just a test 

$ /sendmsg 0x125 "bye" 给 第 三 个 队列 发 


KF 

queue id 196610, message bye 

命名 UNIX 域 套 接 字 

虽然 socketpair 函数 能 创建 一 对 相互 连接 的 套 接 字 ， 但 是 每 一 个 套 
接 字 都 没有 名 字 。 这 意味 着 无 关 进 程 不 能 使 用 它们 。 

在 16.3.4 市 中 学 习 了 如 何 将 一 个 地 址 绑 定 到 一 个 因特网 域 套 接 字 
上 。 恰 如 因特网 域 套 接 字 一 样 ， 可 以 命名 UNIX 域 僚 接 字 ， 并 可 将 其 用 
于 告示 服务 。 但 是 要 注意 ，UNIX 域 套 接 字 使 用 的 地 址 格式 不 同 于 因 特 
网 域 套 接 字 。 

回忆 16.3 方 ， 套 接 字 地 址 格式 会 随 实现 而 变 。UNIX 域 套 接 字 的 
地 址 由 sockaddr un 结构 表示 。 在 Linux 3.2.0 和 Solaris 10 中， 
sockaddr_ un 结构 在 头 文件 <sysun.h> 中 的 定义 如 下 : 


struct sockaddr un ( 


sa family t sun family; /* AF UNIX */ 
char sun  path[108]; /* pathname */ 
p 
但 是 在 FreeBSD 8.0 和 Mac OS X 10.6.8'F, sockaddr un 结构 的 定义 
如 下 : 


struct sockaddr un { 


unsigned char sun len; /* sockaddr length */ 
sa family t sun family; /* AF UNIX */ 

char sun path[104]; /* pathname */ 

}; 


sockaddr_ un 结构 的 sun_path 成 员 包 含 一 个 路 径 名 。 当 我 们 将 一 个 地 
址 绑 定 到 一 个 UNIX 域 套 接 字 时 ， 系 统 会 用 该 路 径 名 创建 一 个 
S_IFSOCK 类 型 的 文件 。 

该 文件 仅 用 于 辐 客 户 进程 告示 套 搂 字 名 字 “。 该 文件 无 法 打开 ,也 
不 能 由 应 用 程序 用 于 通信 。 

如 果 我 们 试图 绑 定 同一 地 址 时 ， 该 文件 已 经 存在 ， 那 么 bind 请 求 会 
失败 。 当 关闭 套 接 字 时 ， 并 不 目 动 删除 该 文件 ， 所 以 必须 确 你 在 应 用 
程序 退出 前 ， 对 该 文件 执行 解除 链接 操作 。 

实例 

图 17-5 所 示 的 程序 是 一 个 将 地 址 绑 定 到 UNIX 域 套 接 字 的 例子 。 

运行 此 程序 时 ，bind 请 求 成 功 执行 。 但 是 ， 者 第 二 次 运行 该 程 
序 ， 则 出 错 返 回 ， 其 原因 是 该 文件 已 经 存在 。 在 删除 该 文件 之 前 ， 该 
程序 不 会 再 成 功 运 行 。 

$ ./a.out 1B 
程序 

UNIX domain socket bound 


$ Is -l foo.socket 查看 套 接 


SOME 


次 运 


SIWXIW-XI-X 1 sar 0 May 18 00:44 foo.socket 

$ /a.out 试图 再 
行 该 程序 

bind failed: Address already in use 


$ rm foo.socket 删除 该 
套 接 字 文 件 

$ /a.out 第 三 次 
运行 该 程序 

UNIX domain socket bound 现在 


成 功 啦 


#include "apue.h" 
#include <sys/socket.h> 


#include <sys/un.h> 


int 


main (void) 


{ 


int fd, size; 
struct sockaddr_un un; 


un.sun_family = AF_UNIX; 
strcpy(un.sun path, "foo.socket"); 
if ((fd = socket(AF UNIX, SOCK STREAM, 0)) « 0) 
err sys("socket failed"); 
size = offsetof(struct sockaddr un, sun path) + strlen(un.sun path); 
if (bind(fd, (struct sockaddr *)&un, size) « O0) 
err sys("bind failed"); 
printf ("UNIX domain socket bound*Mn") 
exit (0); 


图 17-5 将 地 址 绑 定 到 UNIX 域 套 接 字 
确定 绑 定 地 址 长 度 的 方法 是 ， 先 计算 sun_path 成 员 在 sockaddr_un 结 


构 中 的 偏 移 量 ， 然 后 将 结果 与 路 径 名 长 度 〈 不 包括 终止 nl 字符) TH 


加 。 


为 sockaddr_un 结 构 中 sun_path 之 前 的 成 员 与 实现 相关 ， 所 以 我 们 


使 用 <stddef.h> 头 文件 (包括 在 apue.h 中 ) 中 的 offsetof 宏 计算 sun_path 成 
员 从 结构 开始 处 的 偏 移 量 。 如 采 查 看 <stddef.h>， 则 可 见 到 类 似 于 下 列 
形式 的 定义 : 
#define offsetof(TYPE, MEMBER) ((int)&((TYPE *)0)->MEMBER) 
假定 该 结构 从 地 址 0 开始 ， 此 表达 式 求 得 成 员 起 始 地 址 的 整 型 值 。 


17.3 唯一 连接 


服务 器 进程 可 以 使 用 标准 bind、1listen 和 accept 函 数 ， 为 客户 进程 安 
排 一 个 唯一 UNIX 域 连接 。 客 户 进程 使 用 connect 与 服务 硕 进 程 联 系 。 在 
服务 硕 进 程 接 受 了 connect 请 求 后 ， 在 服务 器 进程 和 客户 进程 之 间 束 存 
在 了 唯一 连接 。 这 种 风格 的 操作 与 我 们 在 图 16-16 和 图 16-17 中 所 示 的 对 
因特网 域 套 接 字 的 操作 相同 。 

图 17-6 展 示 了 客户 进程 和 服务 需 进 程 存在 连接 之 前 二 者 的 情形 。 服 
务 器 端 把 它 的 套 接 字 绑 定 到 sockaddr_ un 的 地 址 并 监听 新 的 连接 请 求 。 
图 17-7 展 示 了 在 服务 硕 端 接受 客户 端 连接 请 求 后 ， 客 户 端 和 服务 需 端 之 
间 建 立 的 唯一 的 连接 © 

现在 ， 我 们 将 开发 3 个 函数 ， 使 用 这 些 函 数 可 以 在 运行 于 同一 台 计 
算 机 上 的 两 个 无 关 进 程 之 间 创 建 唯 一 连接 。 这 些 函 数 模仿 了 在 16.4 市 
中 讨论 过 的 面向 连接 的 套 接 字 函数 。 这 里 ， 我 们 将 UNIX 域 套 接 字 应 用 
于 底层 通信 机 制 。 


服务 器 进程 


图 17-6 connect 之 前 的 客户 端 
套 接 字 和 服务 器 端 套 接 字 
服务 器 进程 客户 进程 


图 17-7 connect 之 后 的 客户 端 
套 接 字 和 服务 器 端 套 接 字 


#include "apue.h" 


int serv listen(const char *name); 


返回 值 : ARD, ABTA, 奉 出 错 ， 返 回 负 值 


int serv. accept(int listenfd, uid t *uidptr); 
int cli conn(const char *name); 
返回 值 : ARD, RIC, ate, IRI iE 
返回 值 : 者 成功， 返回 文件 描述 符 ; ea fe, ITN i fe 
服务 器 进程 可 以 调用 serv_listen 范 数 ( 见 图 17-8) 声明 它 要 在 一 个 
众所周知 的 名 字 (文件 系统 中 的 某 个 路 径 名 ) 上 监听 客户 进程 的 连接 
请 求 。 当 客户 进程 想 要 连接 至 服务 促进 程 时 ， 它 们 将 使 用 该 名 字 。 
serv_listen 芳 数 的 返回 值 是 用 于 接收 客户 进程 连接 请 求 的 服务 右 UNIX 域 
BIRT o 
服务 器 进程 可 以 使 用 serv_accept 函 数 ( 见 图 17-9) 等 待 客户 进程 连 
接 请 求 的 到 达 。 当 一 个 请 求 到 达 时 ， 系 统 自动 创建 一 个 新 的 UNIX 域 套 
接 字 ， 并 将 它 与 客户 端 套 接 字 连接 ， 最 后 将 这 个 新 套 接 字 返回 给 服务 
器 。 此 外 ， 客 户 进程 的 有 效用 户 ID 存放 在 uidptr 指 向 的 存储 区 中 。 
客户 进程 调用 cli cont 〈 见 图 17-10) 连接 至 服务 器 进程 。 客 户 
进程 指定 的 name 参 数 必 须 与 服务 嫩 进 程 调用 serv_listen 琅 数 时 所 用 的 名 
字 相 同 。 团 数 返 回 时 ， 客 户 进程 得 到 接连 至 服务 俩 进程 的 文件 描述 
f ° 
17-825 H1 T serv. listenER ZA ° 


#include "apue.h" 
#include <sys/socket.h> 
#include <sys/un.h> 
#include <errno.h> 


#define QLEN 10 


/* 

* Create a server endpoint of a connection. 
* Returns fd if all OK, «0 on error. 

*/ 

int 

serv listen(const char *name) 

( 


int fd, len, err, rval; 


struct sockaddr un un; 


if (strlen(name) >= sizeof(un.sun path)) { 
errno - ENAMETOOLONG; 
return(-1); 


) 


/* create a UNIX domain stream socket */ 
if ((fd = socket(AF UNIX, SOCK STREAM, 0)) « 0) 
return(-2); 


unlink (name); /* in case it already exists */ 


/* fill in socket address structure */ 

memset(&un, 0, sizeof(un)); 

un.sun family = AF UNIX; 

strcpy(un.sun path, name); 

len = offsetof(struct sockaddr un, sun path) + strlen(name); 


/* bind the name to the descriptor */ 

if (bind(fd, (struct sockaddr *)&un, len) « 0) { 
rval = -3; 
goto errout; 


) 


if (listen(fd, QLEN) < 0) { /* tell kernel we're a server */ 
rval = -4; 
goto errout; 

} 


return (fd); 


errout: 
err = errno; 
close (fd); 
errno = err; 
return (rval); 


图 17-8 serv_listenEK AX 


首先 ， 调 用 socket 创 建 一 个 UNIX 域 套 接 字 。 然 后 将 欲 赋 给 套 接 字 
的 众所周知 的 路 径 名 填 入 sockaddr_ un 结构 。 该 结构 是 调用 bind 的 参 
数 。 注 意 ， 不 需要 设置 某 些 平台 提供 的 sun_len 字 段 ， 因 为 操作 系统 会 
用 传送 给 bind 函 数 的 地 址 长 度 设置 该 字段 。 

Ba, VüHBlistenE«3 〈 见 16.4 节 ) 来 通知 内 核 该 进程 将 作为 服务 
器 进程 等 待 客 户 进程 的 连接 请 求 。 当 收 到 一 个 客户 进程 的 连接 请 求 
后 ， 服 务 器 进程 调用 serv_accept 了 范 数 〈 见 图 17-9) ° 


#include "apue.h" 
#include <sys/socket.h> 
#include <sys/un.h> 
#include <time.h> 
#include <errno.h> 


#define STALE 30 /* client's name can't be older than this (sec) */ 


/* 


* Wait for a client connection to arrive, and accept it. 
* We also obtain the client's user ID from the pathname 
* that it must bind before calling us. 

* Returns new fd if all OK, «0 on error 

tif 

int 

serv accept(int listenfd, uid t *uidptr) 


( 


int clifd, err, rval; 
socklen t len; 

time t staletime; 

struct sockaddr_un un; 

struct stat statbuf; 

char *name; 


/* allocate enough space for longest name plus terminating null */ 
if ((name = malloc(sizeof(un.sun_path) + 1)) == NULL) 
return(-1); 
len = sizeof (un); 
if ((clifd = accept(listenfd, (struct sockaddr *)&un, &len)) < 0) { 
free (name) ; 
return (-2); /* often errno=EINTR, if signal caught */ 


/* obtain the client's uid from its calling address */ 


len -= offsetof(struct sockaddr_un, sun_path); /* len of pathname */ 
memcpy (name, un.sun path, len); 
name[len] - 0; /* null terminate */ 
if (stat(name, &statbuf) « 0) { 
rval = -3; 


goto errout; 


#ifdef S_ISSOCK /* not defined for SVR4 */ 
if (S ISSOCK(statbuf.st mode) == 0) { 
rval = -4; /* not a socket */ 


goto errout; 


} 
#fendif 


if ((statbuf.st mode & (S IRWXG | S IRWXO)) || 
(statbuf.st mode & S IRWXU) ! IRWXU) ( 
rval  —-5; /* is not rwx------ Af 
goto errout; 


Il 
v | 


staletime = time(NULL) - STALE; 
if (statbuf.st_atime < staletime || 
statbuf.st_ctime < staletime | | 
statbuf.st_mtime < staletime) { 
rval = -6; /* i-node is too old */ 
goto errout; 


if (uidptr != NULL) 


*uidptr = statbuf.st uid; /* return uid of caller */ 
unlink (name); /* we're done with pathname now */ 
free (name); 
return(clifd); 


Grrout: 
err - errno; 
close (clifd); 
free (name) ; 
errno = err; 
return (rval); 


图 17-9 serv_acceptiH Zi 


服务 絮 进 程 在 调用 serv_accept 中 阻塞 ， 等 得 一 个 客户 进程 调用 
cli_conn。 从 accept 返 回 时 ， 返 回 值 是 连接 到 客户 进程 的 办 新 的 摘 壕 

。 另外，accept 范 数 也 经 由 其 第 二 个 参数 ( 指 癌 sockaddr_un 结 构 的 指 
返回 客户 进程 赋 给 其 套 接 字 的 路 径 名 ( 包 舍 客户 进程 有 D 的 名 
F) 。 接 着 ， 程 序 复制 这 个 路 径 名 ， 并 确保 它 是 以 null 终 止 的 (如果 路 
径 名 占用 了 sockaddr_ un 结构 里 的 sun_path 成 员 所 有 的 可 用 空间 ， 那 就 没 
有 空间 存放 终止 null 字 符 ) 。 然 后 ， 调 用 stat 函 数 验证 : 该 路 径 名 确实 
是 一 个 套 接 字 ; 其 权限 仅 允 许 用 户 读 、 用 户 写 以 及 用 户 执行 。 还 要 验 
证 与 套 接 字 相 关联 的 3 个 时 间 参 数 不 比 当 前 时 间 早 30 秒 。 (回忆 6.10 
ur time EN BOK [p] 24 Bi E Ta] A HA, 用 公元 1970 年 1 月 1 日 00:00:00 以 来 

过 的 秒 数 表 示 。) 

如 车 通过 了 所 有 这 些 检验 ， 则 可 认为 客户 进程 的 身份 (其 有 效用 
FID) 是 该 套 接 字 的 所 有 者 。 dn ， 但 这 是 对 当前 
系统 所 能 做 到 的 最 佳 方 案 。 (如 若 内 核能 通过 accept 的 参数 返回 有 效 
用 户 ID， 则 会 更 好 一 些 。) 

客户 进程 调用 cli_conn 函 数 〈 见 图 17-10) 对 连 到 服务 器 进程 的 连接 
进行 初始 化 。 


#include "apue.h" 
#include <sys/socket.h> 
#include <sys/un.h> 
#include <errno.h> 


#define CLI_PATH » /var/tmp/ = 
#define CLI_PERM S_IRWXU /* rwx for user only */ 
/* 


* Create a client endpoint and connect to a server. 
* Returns fd if all OK, «0 on error. 

ki 

int 

cli conn(const char *name) 


{ 


int fd, len, err, rval; 
struct sockaddr_un un, sun; 
int do_unlink = 0; 


if (strlen(name) >= sizeof(un.sun_path)) { 
errno = ENAMETOOLONG; 
return (-1); 


/* create a UNIX domain stream socket */ 
if ((fd = socket(AF UNIX, SOCK STREAM, 0)) « 0) 
return(-1); 


/* fill socket address structure with our address */ 

memset(&un, 0, sizeof(un)); 

un.sun_family = AF_UNIX; 

sprintf(un.sun path, "$s$051d", CLI PATH, (long) getpid()); 

len = offsetof(struct sockaddr un, sun path) + strlen(un.sun path); 


unlink(un.sun path); /* in case it already exists */ 
if (bind(fd, (struct sockaddr *)&un, len) < 0) { 
rval = -2; 


goto errout; 
} 
if (chmod(un.sun_path, CLI_PERM) < 0) { 
rval = -3; 
do_unlink = 1; 
goto errout; 


} 


/* fill socket address structure with server's address */ 
memset(&sun, 0, sizeof(sun)); 
sun.sun family = AF UNIX; 
strcpy(sun.sun path, name); 
len = offsetof(struct sockaddr un, sun path) + strlen(name); 
if (connect(fd, (struct sockaddr *)&sun, len) < 0) { 
rval = -4; 
do_unlink = 1; 
goto errout; 
} 
return (fd); 


errout: 
err = errno; 
close (fd); 
if (do_unlink) 
unlink(un.sun path); 
errno - err; 
return (rval); 


图 17-10 cli conmn 函 数 


调用 socket 函数 创建 UNIX 域 套 接 字 的 客户 进程 端 ， 人 然后 用 客户 
进程 专 有 的 名 字 填 入 sockaddr_ un 结构 。 

此 例 中 没 让 系统 选择 默认 地 址 ， 其 原因 是 ， 如 果 这 样 处 理 ， 服 务 
器 进程 将 不 能 区 分 各 个 客户 进程 《如果 不 为 UNIX 域 套 接 字 显 式 地 绑 定 
名 字 ， 内 核 会 代表 我 们 隐 式 地 绑 定 一 个 地 址 且 不 会 在 文件 系统 创建 文 


= 


件 来 表示 这 个 套 接 字 ) 。 于 是 ， 我 们 绑 定 自己 的 地 址 ， 但 在 开发 使 用 
套 接 字 的 客户 端 程序 时 通常 并 不 采用 这 一 步骤 。 

绑 定 的 路 径 名 的 最 后 5 个 字符 来 目 客 户 进 程 ID。 仅 在 该 路 径 名 已 存 
在 时 调用 unlink。 然 后 ， 调 用 bind 将 名 字 赋 给 客户 进程 套 接 字 。 这 在 文 
件 系统 中 创建 了 一 个 套 搂 字 文 件 ， 所 用 的 名 字 与 被 绑 定 的 路 径 名 一 
样 。 接 着 ， 调 用 chmod 关闭 除 用 户 读 、 用 户 写 以 及 用 户 执行 以 外 的 其 
他 权限 。 在 serv_accept 中 ， 服 务 此 进程 检验 这 些 权 限 以 及 套 接 子 用 户 ID 
以 验证 客户 进程 的 号 份 。 

然后 ， 必 须 填 充 另 一 个 sockaddr_un 结 构 ， 这 次 用 的 是 服务 进程 众 
所 周知 的 路 径 名 。 最 后 ， 调 用 connect 画 数 初 始 化 与 服务 进程 的 连接 © 


17.4 传送 yli 


FERN ERR LZ [RI PR ITT 7T OCTETR VULT HJ BK ee AF T8 78 FR] o ALL, 
可 以 对 客户 进程 -服务 器 进程 应 用 进行 不 同 的 设计 。 它 使 一 个 进程 OB 
常 是 服务 器 进程 ， 能 够 处 理 打开 一 个 文件 所 要 做 的 一 切 操 作 (包括 将 
网 络 名 翻译 为 网 络 地 址 、 挨 号 调制 解 调 器 、 协 商 文 件 锁 等 ， 以 及 向 调 
用 进程 送 回 一 个 插 述 得 ， 该 插 述 得 可 被 用 于 以 后 的 所 有 LO 函数 。 涉 及 
打开 文件 或 设备 的 所 有 细节 对 客户 进程 而 言 都 是 透明 的 。 

下 面 进一步 说 明 从 一 个 进程 癌 男 一 个 进程 “传送 一 个 打开 文件 接 述 
Wa Me ANCA 3-8， 其 中 显示 了 两 个 进程 ， 它 们 打开 了 同一 文 
件 。 虽 然 它 们 共享 同一 个 v 太 点 ， 但 每 个 进程 都 有 它 自 己 的 文件 表 项 。 

当 一 个 进程 同 另 一 个 进程 传送 一 个 打开 文件 描述 符 时 ， 我 们 想 让 
发 送 进程 和 接收 进程 共享 同一 文件 表 项 。 图 17-11 显 示 了 所 期 望 的 安 
排 。 


进程 表 项 


fc 
标志 “文件 指针 
2r 文件 表 


文件 状态 标志 


当前 文件 偏 移 量 | v 节 点 表 


v 节 点 指针 。 — " |. v 节 点 信息 


进程 表 项 


fc 
标志 文件 指针 


图 17-11 从 顶部 进程 传送 一 个 打开 文件 至 底部 进程 

在 技术 上 ， 我 们 是 将 指向 一 个 打开 文件 表 项 的 指针 从 一 个 进程 发 
送 到 另外 一 个 进程 。 该 指针 被 分 配 存放 在 接收 进程 的 第 一 个 可 用 描述 
符 项 中 。 注意， 不 要 造成 错觉 ， 以 为 发 送 进程 和 接收 进程 中 的 描述 
符 编号 是 相同 的 ， 它 们 通常 是 不 同 的 。) 两 个 进程 共享 同一 个 打开 文 
件 表 ， 这 与 fork 之 后 的 父 进 程 和 子 进 程 共享 打开 文件 表 的 情况 完全 相同 
( 见 图 8-2) 

当 发 送 进 程 将 描述 符 传 送 给 接收 进程 后 ， 通 常会 天 闭 该 描述 从 。 
发 送 进 程 关 闭 该 描述 符 并 不 会 真 的 关闭 该 文件 或 设备 ， 其 原因 是 该 描 
述 符 仍 被 视 为 由 接收 进程 打开 (即使 接收 进程 尚未 接收 到 该 描述 
符 ) 


下 面 定义 本 章 用 以 发 送 和 接收 文件 描述 符 的 3 个 函数 。 本 节 后 面 会 
给 出 这 3 个 函数 的 代码 。 

#include "apue.h" 

int send. fd(int fd, int fd to send); 

int send err(int fd, int status, const char *errmsg); 

两 个 函数 的 返回 值 : 大 成 功 ， 返 回 0; 者 出 错 ， 返 回 -1 

int recv_fd(int fd, ssize t (*userfunc)(int, const void *, size t)); 

IRE: 者 成 功 ， 返 回 文件 描述 符 ; a fe, ITN i fe 

当 一 个 进程 〈 通 常 是 服务 器 进程 ) 想 将 一 个 描述 符 传 送 给 另 一 个 
进程 时 ， 可 以 调用 send_fd 或 send_err。 等待 接收 描述 符 的 进程 (客户 进 
Fi) 调用 recv_fd。 

send fd 使 用 fd 代表 的 UNIX 域 套 接 字 发 送 摘 述 和 从 fd_to_send 。 
send err {Ë FA fd & 3% errmsg DA X Ja BB HJ status F T ° status HY E AY E -1 
~-255 ° 

客户 进程 调用 recv_fd 接收 描述 符 。 如 有 果 一 切 正 党 (发 送 者 调用 了 
send fd) ， 则 函数 返回 值 为 非 负 描述 符 。 和 否则 ， 返 回 值 是 由 send_err 发 
送 的 status (-1~-255 的 一 个 负 值 ) 。 另 外 ， 如 果 服 务 器 进程 发 送 了 一 
条 出 错 消 息 ， 则 客户 进程 调用 它 目 己 的 userfunc 函数 处 理 该 消 轧 。 
userfunc 的 第 一 个 参数 是 常量 STDERR_FILENO， 然 后 是 指向 出 错 消 息 
的 指针 及 其 长 度 。userfunc 函 数 的 返回 值 是 已 写 的 字 下 数 或 负 的 出 钳 编 
号 值 。 客 户 进程 党 将 普通 的 write 函数 指定 为 userfunc 。 

我 们 实现 用 于 这 3 个 函数 的 我 们 目 己 制定 的 协议 。 为 发 送 一 个 摘 
X^, send fd 多 发 送 2 字 有 0， 然 后 是 实际 描述 待 。 为 了 发 送 一 条 出 错 
消息 ，send_err 发 送 errmsg， 然 后 是 1 字 节 0， 最 后 是 status 字 六 的 绝对 值 

(17-255) 。recv_fd 范 数 读 取 套 接 字 中 所 有 字 世 直至 遇 到 null 字 符 。 
null 字 符 之 前 的 所 有 字符 都 传送 给 调用 者 的 userfunc。recv_fd 读 取 的 下 


一 个 字 市 是 状态 (status) FT ° ARSE TAO, WR T RV C. 


传送 过 来 ， 否 则 表示 没有 摘 述 符 可 接收 。 
send_err 畏 数 在 将 出 错 消 息 写 到 套 接 字 后 ， 即 调用 send_fd 函 数 ， 如 


图 17-12 所 示 。 


finclude "apue.h" 


/* 
* Used when we had planned to send an fd using send fd(), 
* but encountered an error instead. We send the error back 
* using the send fd()/recv fd() protocol. 

x 

int 

send err(int fd, int errcode, 


( 


const char *msg) 


int ns 


if ((n = strlen(msg)) > 0) 
if (writen(fd, msg, n) !- n) 


return(-1); 


/* send the error message */ 


if (errcode »- 0) 
/* must be negative */ 


errcode = -1; 


if (send fd(fd, errcode) « 0) 


return(-1); 


图 17-12 send errÉR Zi 
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msghdr 结 构 的 指针 ， 该 结构 包含 了 所 有 关于 要 发 送 或 要 接收 的 消息 的 
信息 。 该 结构 的 定义 大 致 如 下 : 


struct msghdr 1 
void *msg name; 


socklen t msg namelen; 


struct iovec  *msg iov; 


/* optional address */ 
/* address size in bytes */ 


/* array of I/O buffers */ 


int msg iovlen; /* number of elements 


in array */ 
void *msg. control; /* ancillary data */ 
socklen t msg controllen; /* number of ancillary bytes 
* 
int msg. flags; /* flags for received 
message */ 
js 


前 两 个 元 素 通常 用 于 在 网 络 连 接 上 发 送 数据 报 ， 其 中 目的 地 址 可 

以 由 每 个 数据 报 指 定 。 接 下 来 的 两 个 元 素 使 我 们 可 以 指定 一 个 由 多 个 

缓冲 区 构成 的 数组 (散布 恋 和 聚集 写 ) ， 这 与 对 readv 和 writev 函 数 

( 见 14.6 节 ) 的 说 明 一 样 。msg_flags 字 段 包 含 了 描述 接收 到 的 消息 的 
标志 ， 图 16-15 总 结 了 这 些 标志 。 

两 个 元 素 处 理 控 制 信息 的 传送 和 接收 。msg_control 字 段 指 向 

cmsghdr (控制 信息 头 ) 结构 ，msg_controllen 字 上 段 包 含 控 制 信息 的 字 节 


struct cmsghdr { 


socklen t cmsg len; /* data byte count, including header */ 
int cmsg level; /* originating protocol */ 
int cmsg, type; /* protocol-specific type */ 


/* followed by the actual control message data */ 
Js 
为 了 发 送 文件 描述 符 ， 将 cmsg len 设置 为 cmsghdr 结 构 的 长 度 加 一 
个 整 型 的 长 度 〈 描 述 符 的 长 度 ) ，cmg level 字 上 段 设 置 为 
SOL SOCKET, cmsg type 字段 设置 为 SCM_RIGHTS， 用 以 表明 在 传送 
访问 权 。 (SCM 是 Socket-level Control Message 的 缩写 ， 即 套 接 字 级 挖 


制 消息 。) 访问 权 仅 能 通过 UNIX 域 套 接 字 传 送 。 描 述 符 紧 随 cmsg_type 
字段 之 后 存储 ， 用 CMSG_DATA 宏 获得 该 整 型 量 的 指针 。 
在 此 定义 3 个 安 ， 用 于 访问 控制 数据 ， 一 个 安 用 于 帮助 计算 
cmsg len 所 使 用 的 值 。 
#include <sys/socket.h> 
unsigned char *CMSG_DATA(struct cmsghdr *cp); 
返回 值 ， 返 回 一 个 指针 ， 指 癌 与 cmsghdr 结 构 相 关联 的 数据 
struct cmsghdr *CMSG_FIRSTHDR(struct msghdr *mp); 
返回 值 : 返回 一 个 指针 ， 指 向 与 nsghdr 结 构 相 关联 的 第 一 个 cmsghdr 结 
TJ. 
ICIS EY, JxR[SINULL 
struct cmsghdr *CMSG_NXTHDR(struct msghdr *mp, 
struct cmsghdr *cp); 
返回 值 : 返回 一 个 指针 ， 指 向 与 nsghdr 结 构 相 关联 的 下 一 个 cmsghdr 结 
构 ， 该 msghdr 结 构 给 出 了 当前 的 cmsghdr 结 构 ， 若 当前 cmsghdr 结 构 已 
是 最 后 一 个 ， 返 回 NULL 
unsigned int CMSG LEN(unsigned int nbytes); 
返回 值 : 返回 为 nbytes 长 的 数据 对 象 分 配 的 长 度 
Single UNIX Specification 定义 了 前 3 个 宏 ， 但 没有 定义 
CMSG LEN ° 
CMSG_LEN 宏 返回 存储 nbytes 长 的 数据 对 象 所 需 的 字 节 数 ， 它 先 
将 nbytes 加 上 cmsghdr 结 构 的 长 度 ， 然 后 按 处 理 才 体系 结构 的 对 齐 要 求 
进行 调整 ， 最 后 再 向 上 取 整 。 
图 17-13 中 的 程序 是 UNIX 域 套 接 字 的 send_fd 函 数 ， 它 通过 UNIX 域 
套 接 字 传 递 文 件 描述 符 。sendmsg 调 用 被 用 来 传送 协议 数据 (包括 null 
FERRASTE) 以 及 描述 符 。 


#include "apue.h" 
#include <sys/socket.h> 


/* size of control buffer to send/recv one file descriptor */ 
#define CONTROLLEN CMSG_LEN (sizeof (int) ) 


static struct cmsghdr *cmptr = NULL; /* malloc'ed first time */ 


/* 
* Pass a file descriptor to another process. 
* If fd«0, then -fd is sent back instead as the error status. 
Tf 
int 
send fd(int fd, int fd to send) 
{ 
struct iovec iov [1] + 
struct msghdr msg; 


char buf [2]; /* send_fd()/recv_fd() 2-byte protocol */ 
iov[0].iov base = buf; 

iov[0].iov len = 2; 

msg.msg_iov = iov; 

msg.msg_iovlen = 1; 

msg.msg_name = NULL; 

msg.msg_namelen = 0; 


if (fd_to_send < 0) { 


msg.msg_control = NULL; 
msg.msg_controllen = 0; 
buf[1] = -fd_to_send; /* nonzero status means error */ 
if (buf[1] == 0) 
buf[1] = 1; /* -256, etc. would screw up protocol */ 
) else ( 
if (cmptr == NULL && (cmptr = malloc(CONTROLLEN)) == NULL) 


return(-1); 
cmptr-»cmsg level = SOL SOCKET; 


cmptr-»cmsg type = SCM RIGHTS; 
cmptr-»cmsg len = CONTROLLEN; 
msg.msg control = cmptr; 
msg.msg controllen = CONTROLLEN; 
*(int *)CMSG DATA(cmptr) = fd to send; /* the fd to pass */ 
burti = 0: /* zero status means OK */ 
} 
buf[0] = 0; /* null byte flag to recv_fd() */ 
if (sendmsg (fd, &msg, 0) != 2) 


return (-1); 
return (0); 


图 17-13 通过 UNIX 域 套 接 字 发 送 文件 描述 得 


为 了 接收 一 个 文件 描述 符 〈 见 图 17-14) ， 我 们 为 cmsghdr 结 构 和 描 
述 符 分 配 了 足够 大 的 空间 ， 设 置 msg_control 指 向 该 分 配 到 的 存储 区 ， 
然后 调用 了 recvmsg。 使 用 CMSG_LEN 宏 计算 所 需 的 空间 总 量 。 

读 取 UNIX 域 套 接 字 ， 直 至 读 到 null 字 节 ， 它 位 于 最 后 的 状态 字 节 
之 前 。null 字 节 之 前 是 一 条 来 自发 送 者 的 出 错 消息 。 


#include "apue.h" 
#include <sys/socket.h> /* struct msghdr */ 


/* size of control buffer to send/recv one file descriptor */ 
#define CONTROLLEN CMSG LEN (sizeof (int) ) 


static struct cmsghdr *cmptr = NULL; /* malloc'ed first time */ 


/* 

* Receive a file descriptor from a server process. Also, any data 
* received is passed to (*userfunc) (STDERR FILENO, buf, nbytes). 

* We have a 2-byte protocol for receiving the fd from send fd(). 
d 

int 

recv fd(int fd, ssize t (*userfunc) (int, const void *, size t)) 


{ 


int newfd, nr, status; 

char SBER 

char buf [MAXLINE] ; 

struct iovec iov[1]; 

struct msghdr msg; 

status = -1; 

for ( y Wi 
iov[0].iov base = buf; 
iov[0].iov len = sizeof (buf); 
msg.msg_iov = iov; 
msg.msg_iovlen = 1; 
msg.msg_name = NULL; 
msg.msg_namelen = 0; 
if (cmptr == NULL && (cmptr = malloc(CONTROLLEN)) == NULL) 


return (-1); 

msg.msg_control = cmptr; 

msg.msg_controllen = CONTROLLEN; 

if ((nr = recvmsg(fd, &msg, 0)) < 0) { 
err ret("recvmsg error"); 
return(-1); 

} else if (nr == 0) { 


err ret("connection closed by server"); 
return(-1); 


) 


/* 
* See if this is the final data with null & status. Null 
* is next to last byte of buffer; status byte is last byte. 
* Zero status means there is a file descriptor to receive. 
ef 
for (ptr = buf; ptr < &buf[nr]; ) ( 
if (*ptr++ == 0) { 
if (ptr != &buf[nr-1]) 
err dump("message format error"); 
status = *ptr & OxFF; /* prevent sign extension */ 
if (status == 0) { 
if (msg.msg_controllen < CONTROLLEN) 
err_dump("status = 0 but no fd"); 
newfd = *(int *)CMSG DATA(cmptr) ; 
} else { 
newfd = -status; 
} 
nr -= 2; 
} 
} 
if (nr > 0 && (*userfunc) (STDERR FILENO, buf, nr) != nr) 
return (-1); 
if (status >= 0) /* final data has arrived */ 
return (newfd); /* descriptor, or -status */ 


图 17-14 通过 UNIX 域 套 接 字 接收 文件 描述 符 

注意 ， 该 程序 总 是 准备 接收 一 个 描述 符 (在 每 次 调用 recvmsg 之 
前 ， 设 置 msg_control 和 msg_controllen) ， 但 是 仅 当 msg_controllen 返 回 
的 是 非 0 值 时 ， 才 确实 接收 到 描述 符 。 

回忆 serv_accept 函 数 〈 见 图 17-9) 确定 调用 者 身份 的 步骤 。 如 果 内 
核能 够 把 调用 者 的 证 书 在 调用 accept 之 后 返回 给 调用 处 会 更 好 。 某 些 
UNIX 域 套 接 字 的 实现 提供 类 似 的 功能 ， 但 它们 的 接口 不 同 。 

FreeBSD 8.0 和 Linux 3.2.0 都 文 持 通 过 UNIX 域 套 接 字 发 送 证 书 ， 但 
它们 的 实现 方式 不 同 。Mac OS X 10.6.8 是 部 分 从 FreeBSD 派 生出 来 的 ， 
但 禁止 传送 证 书 。Solaris 10 不 文 持 通 过 UNIX 域 套 接 字 传送 证 书 ， 然 而 


它 文 持 从 一 个 通过 STREAMS 管 道 传 输 文 件 摘 述 符 的 进程 中 获得 证 书 ， 
这 里 我 们 不 讨论 它 的 细节 。 

在 FreeBSD 中 ， 将 证 书 作 为 cmsgcred 结 构 传 送 。 

#define CMGROUP MAX 16 


struct cmsgcred 1 


pid t cmcred pid; /* sender's process ID */ 
uid t cmcred uid; /* sender's real UID */ 
uid t cmcred euid; /* sender's effective UID */ 
gid t cmcred gid; /* sender's real GID */ 


short cmcred ngroups; /* number of groups */ 
gid t cmcred groups|CMGROUP MAX]; /* groups */ 
is 
在 传送 证 书 时 ， 仅 需 为 cnmnsgcred 结 构 保留 存储 空间 。 内 核 将 填充 该 
结构 以 防止 应 用 程序 伪装 成 具有 男 一 种 身份 。 
在 Linux 中 ， 将 证 书 作 为 ucred 结 构 传 送 。 


struct ucred { 


pid t pid; /* sender's process ID */ 
uid t uid; /* sender's user ID */* sender's group ID */ 
gid t gid; 
b 
与 FreeBSD 不 同 ，Linux 需 要 在 传输 前 初始 化 这 个 结构 。 内 核 会 确 
保 应 用 程序 要 么 能 够 使 用 对 应 调用 者 的 值 ， 要 么 有 使 用 其 他 值 的 合适 
权限 。 
图 17-15 显 示 了 更 新 过 后 的 send_fd 函 数 ， 它 包含 了 发 送 进程 的 证 
书 。 


#include "apue.h" 
#include <sys/socket.h> 


#if defined (SCM_CREDS) /* BSD interface */ 
#define CREDSTRUCT cmsgcred 

#define SCM CREDTYPE SCM CREDS 

#elif defined(SCM CREDENTIALS) /* Linux interface */ 
#define CREDSTRUCT ucred 

#define SCM CREDTYPE SCM_CREDENTIALS 

#telse 


#error passing credentials is unsupported! 
#tendif 


/* size of control buffer to send/recv one file descriptor */ 
#define RIGHTSLEN CMSG_LEN (sizeof (int) ) 

#define CREDSLEN CMSG_LEN (sizeof (struct CREDSTRUCT) ) 
#define CONTROLLEN (RIGHTSLEN + CREDSLEN) 


static struct cmsghdr *cmptr = NULL; /* malloc'ed first time */ 


/* 
* Pass a file descriptor to another process. 
* If fd«0, then -fd is sent back instead as the error status. 
ey 
int 
send_fd(int fd, int fd_to_send) 
{ 
struct CREDSTRUCT *credp; 


struct cmsghdr *cmp; 

struct iovec iew[t]$? 

struct msghdr msg; 

char buf[2]; /* send fd/recv ufd 2-byte protocol */ 
iov[0].iov base = buf; 

iov[0].iov len = 2; 

msg.msg iov - iov; 

msg.msg iovlen = 1; 


msg.msg name = NULL; 
msg.msg namelen - 0; 
msg.msg flags - 0; 

if (fd to send « 0) ( 


msg.msg control = NULL; 

msg.msg controllen - 0; 

buf[1] = -fd to send; /* nonzero status means error */ 

if (buf[1] == 0) 
buf[1] = 1; /* -256, etc. would screw up protocol */ 

) else { 

if (cmptr -- NULL && (cmptr - malloc(CONTROLLEN)) -- NULL) 
return(-1); 

msg.msg control = cmptr; 


msg.msg controllen - CONTROLLEN; 
cmp — cmptr; 
cmp-»cmsg level = SOL SOCKET; 


cmp-»cmsg type = SCM RIGHTS; 

cmp-»cmsg len = RIGHTSLEN; 

*(int *)CMSG DATA(cmp) = fd to send; /* the fd to pass */ 
cmp = CMSG NXTHDR(&msg, cmp); 

cmp->cmsg_level = SOL SOCKET; 

cmp-»cmsg type = SCM CREDTYPE; 

cmp->cmsg_len = CREDSLEN; 

credp = (struct CREDSTRUCT *)CMSG DATA(cmp); 


#if defined(SCM CREDENTIALS) 
credp->uid = geteuid(); 


credp->gid = getegid(); 
credp->pid = getpid(); 
fendif 
bast [i = 03 /* zero status means OK */ 
} 
buf[0] = 0; /* null byte flag to recv ufd() */ 
if (sendmsg(fd, &msg, 0) != 2) 


return(-1); 
return(0); 


图 17-15 通过 UNIX 域 套 接 字 发 送 证 书 
注意 ， 只 有 在 Linux 上 才 需 要 初始 化 证 书 结构 。 
图 17-16 中 的 recv_ufd 函 数 是 recv_fd 的 修改 版 ， 它 通过 一 个 引用 参 

数 返 回 发 送 者 的 用 户 ID 。 


#include "apue.h" 
#include <sys/socket.h> /* struct msghdr */ 
#include <sys/un.h> 


#if defined(SCM CREDS) /* BSD interface */ 
#define CREDSTRUCT cmsgcred 

#define CR UID cmcred uid 

#define SCM CREDTYPE SCM_CREDS 

#elif defined (SCM CREDENTIALS) /* Linux interface */ 
#define CREDSTRUCT ucred 

#define CR_UID uid 

#define CREDOPT SO_PASSCRED 

#define SCM_CREDTYPE SCM_CREDENTIALS 


#felse 


#error passing credentials is unsupported! 


fendif 


/* size of control buffer to send/recv one file descriptor */ 


#define RIGHTSLEN 
#define CREDSLEN 
#define CONTROLLEN 


CMSG LEN (sizeof (int) ) 
CMSG LEN (sizeof (struct CREDSTRUCT) ) 
(RIGHTSLEN + CREDSLEN) 


static struct cmsghdr 


/* 


* Receive a file descriptor from a server process. 


* received is passed to 


*cmptr = NULL; 


Also, 


(*userfunc) (STDERR FILENO, buf, 


any data 


nbytes). 


* We have a 2-byte protocol for receiving the fd from send fd(). 


kj 


int 


recv ufd(int fd, uid t *uidptr, 


Ssize t (*userfunc) (int, const void *, size t)) 
{ 
struct cmsghdr *cmp; 
struct CREDSTRUCT *credp; 
char *ptr; 
char buf [MAXLINE]; 
struct iovec iov[1]; 
struct msghdr msg; 
int nr; 
int newfd = -1; 
int status - -1; 
#if defined (CREDOPT) 
const int on = 1; 
if (setsockopt(fd, SOL SOCKET, CREDOPT, &on, sizeof(int)) « 0) 
err ret("setsockopt error"); 
return(-1); 
} 
#endif 
for (2 #2) Íí 
iov[0].iov base = buf; 
iov[0].iov len = sizeof (buf); 
msg.msg_iov = iov; 
msg.msg_iovlen = 1; 
msg.msg name = NULL; 
msg.msg namelen - 0; 
if (cmptr == NULL && (cmptr = malloc(CONTROLLEN)) == NULL) 
return(-1); 
msg.msg control = cmptr; 


msg.msg controllen - CONTROLLEN; 
if ((nr = émsg, 0)) « O) { 
err ret("recvmsg error"); 


recvmsg (fd, 


return(-1); 

(nr == 0) { 

err_ret ("connection closed by server"); 
return(-l); 


) else if 


/* malloc'ed first time */ 


{ 


/* 

* See if this is the final data with null & status. Null 

* is next to last byte of buffer; status byte is last byte. 
* Zero status means there is a file descriptor to receive. 


af 
for (ptr = buf; ptr < &buf[nr]; ) { 
if (*ptr++ == 0) { 
if (ptr != &buf[nr-1]) 
err dump("message format error"); 
status = *ptr & OxFF; /* prevent sign extension */ 
if (status == 0) { 
if (msg.msg_controllen != CONTROLLEN) 
err dump("status = 0 but no fd"); 
/* process the control data */ 
for (cmp = CMSG FIRSTHDR(&msg); 
cmp != NULL; cmp = CMSG_NXTHDR(&msg, cmp)) { 
if (cmp->cmsg_level != SOL SOCKET) 
continue; 
switch (cmp-»cmsg type) { 
case SCM RIGHTS: 
newfd - *(int *)CMSG DATA(cmp); 
break; 
case SCM CREDTYPE: 
credp = (struct CREDSTRUCT *)CMSG DATA(cmp); 
*uidptr = credp-^CR UID; 
} 
} 
} else { 
newfd = -status; 
} 
nr -= 2; 
} 
} 
if (nr > 0 && (*userfunc) (STDERR_FILENO, buf, nr) != nr) 
return (-1); 
if (status >= 0) /* final data has arrived */ 
return (newfd) ; /* descriptor, or -status */ 


图 17-16 通过 UNIX 域 套 接 字 接 收 证 书 


在 FreeBSD 中 ， 指 定 SCM_CREDS 表 示 要 传送 证 书 。 在 Linux 中 ， 
则 使 用 SCM_CREDENTIALS ° 


17.5 open 服 务 嚣 进程 第 1 版 


使 用 文件 摘 述 符 传 送 技术 开发 一 个 open 服务 絮 进 程 一 一 个 由 一 个 
进程 执行 以 打开 一 个 或 多 个 文件 。 该 服务 器 进程 不 是 将 文件 内 容 送 回 
调用 进程 ， 而 是 送 回 一 个 打开 文件 描述 符 。 这 使 该 服务 器 进程 对 任何 
类 型 的 文件 〈 如 设备 或 套 接 字 ) 而 不 单 是 普通 文件 都 能 起 作用 。 客 户 
进程 和 服务 右 进 程 用 IPC 交 换 最 小 量 的 信息 : 从 客户 进程 到 服务 器 进程 
传送 文件 名 和 打开 模式 ， 而 从 服务 絮 进 程 到 客户 进程 返回 播 述 符 。 文 
件 内 容 不 需 通 过 IPC 交 换 。 

将 服务 器 进程 设计 成 一 个 单独 的 可 执行 程序 (或 者 是 由 客户 进程 
执行 的 ， 这 正 是 本 节 所 说 明 的 ; 或 者 是 由 守护 服务 器 进程 执行 的 ， 将 
在 下 一 节 进 行 说 明 ) 有 很 多 优点 。 

“任何 客户 进程 都 能 很 容易 地 和 服务 句 进 程 联 系 ， 这 类 似 于 客户 进 
程 调 用 一 个 库 函 数 。 我 们 没有 将 特定 服务 硬 编码 在 应 用 程序 中 ， 而 是 
设计 了 一 种 可 供 重 用 的 设施 。 

如若 需要 更 改 服务 器 进程 ， 那 么 也 只 影响 一 个 程序 。 相 反 ， 更 新 
一 个 库 函 数 可 能 需要 更 新 调用 此 库 函 数 的 所 有 程序 ( 即 用 连接 编辑 器 
重新 连接 ) 。 共 享 库 函 数 可 以 简化 这 种 更 新 〈 见 7.7 节 ) 。 

“服务 器 进程 可 以 是 一 个 设置 用 户 ID 程序 ， 于 是 使 其 具有 客户 进程 
没有 的 附加 权限 。 注 意 ， 库 函数 〈 或 共享 库 函 数 ) 不 能 提供 这 种 能 
力 o 

客户 进程 创建 一 个 fd 管 道 ， 然 后 调用 fork 和 exec 来 调用 服务 器 进 
程 。 客 户 进 程 使 用 一 端 经 fd 管道 发 送 请 求 ， 服 务 器 进程 使 用 另 一 端 经 fd 
管道 回 送 啊 应 。 

定义 客户 进程 和 服务 器 进程 间 的 应 用 程序 协议 如 下 。 

(1) 客户 进程 通过 fd 管道 向 服务 器 进程 发 送 “open <pathname> 
<openmode>\0” 形 式 的 请 求 。<openmode> 是 数值 ， 以 ASCII 十 进 制 数 表 
示 ， 是 open 函 数 的 第 二 个 参数 。 该 请 求 字 符 串 以 null 字 人 符 终 止 。 


(2) 服务 器 进程 调用 send_fd 或 send_err 回 送 打开 描述 符 或 出 错 消 


这 是 一 个 进程 向 其 父 进程 发 送 打 开 描 述 符 的 实例 。17.6 市 将 修改 此 
实例 来 使 用 一 个 守护 服务 器 进程 ， 它 的 服务 絮 进 程 将 一 个 手 述 符 发 送 
给 一 个 完全 无 关 的 进程 。 

首先 要 有 一 个 头 文件 open.h ( 见 图 17-17) ， 它 包括 标准 头 文件 ， 
JF EXE XC T BURA 0 


#include "apue.h" 
#include «errno.h» 


#define CL OPEN "open" /* client's request for server */ 
int csopen(char *, int); 
图 17-17 open.h 头 文件 


main at ( 见 图 17-18) 是 一 个 循环 ， 它 先 从 标准 输入 读 一 个 路 径 
名 ， 然 后 将 该 文件 复制 到 标准 输出 。 它 调用 csopen 范 数 来 联系 open 服 务 
ante, MARISTA o 


#include "open.h" 
#include «fcntl.h» 
#define BUFFSIZE 8192 


int 
main(int argc, char *argv[]) 


{ 


int n Eds 
char buf [BUFFSIZE]; 
char line[MAXLINE]; 


/* read filename to cat from stdin */ 
while (fgets(line, MAXLINE, stdin) != NULL) { 
if (line[strlen(line) - 1] == '\n') 
line[strlen(line) - 1] = 0; /* replace newline with null */ 


/* open the file */ 
if ((fd = csopen(line, O RDONLY)) « 0) 
continue; /* csopen() prints error from server */ 


/* and cat to stdout */ 
while ((n = read(fd, buf, BUFFSIZE)) > 0) 
if (write(STDOUT FILENO, buf, n) !- n) 
err sys("write error"); 
if (n « 0) 
err sys("read error"); 
close (fd); 


exit (0); 


图 17-18 mainER Zi 


函数 csopen 〈 见 图 17-19) 在 创建 了 fd 管道 之 后 ， 
程 的 fork 和 exec 操 作 。 


finclude "open.h" 
#include <sys/uio.h> /* struct iovec */ 


/* 

* Open the file by sending the "name" and "oflag" to the 
* connection server and reading a file descriptor back. 
E 

int 

csopen(char *name, int oflag) 

( 


pid t pid; 

Lc len; 

char buf£[10]; 

struct iovec iov[3]; 

static int fd[2] = { =1, =L }3 

if (fd[0] « O) ( /* fork/exec our open server first time */ 


if (fd pipe(fd) < 0) ( 
err ret("fd pipe error"); 
return(-1); 

} 

if ((pid = fork()) < 0) { 
err_ret ("fork error"); 


return (-1); 
} else if (pid == 0) { /* child */ 
close(fd[0]); 
if (fd[1] != STDIN FILENO && 
dup2(fd[1], STDIN FILENO) != STDIN FILENO) 
err sys("dup2 error to stdin"); 
if (fd[1] != STDOUT FILENO && 
dup2(fd[1], STDOUT FILENO) != STDOUT FILENO) 


err sys("dup2 error to stdout"); 
if (execl("./opend", "opend", (char *)0) « 0) 
err sys("execl error"); 
} 
close(fd[1]); /* parent */ 


} 
sprintf (buf, " %d", oflag); /* oflag to ascii */ 


iov[0].iov base = CL OPEN " "; /* string concatenation */ 
iov[0].iov len = strlen(CL OPEN) + 1; 

iov[1].iov base = name; 

iov[1].iov len = strlen(name); 

iov[2].iov base = buf; 

iov[2].iov len = strlen(buf) + 1; /* *1 for null at end of buf */ 
len = iov[0].iov len + iov[1].iov len + iov[2].iov len; 

if (writev(fd[0], &iov[0], 3) != len) { 


err ret("writev error"); 
return(-1); 


) 


/* read descriptor, returned errors handled by write() */ 
return(recv fd(fd[0], write)); 


图 17-19 csopenER 2X 

子 进程 关闭 fd 管道 的 一 端 ， 父 进程 关闭 另 一 端 。 作 为 服务 圳 进程 ， 
子 进程 也 将 fd 管道 的 一 端 复制 到 其 标准 输入 和 标准 输出 。 ( 男 一 种 可 选 
择 的 方案 是 ， 将 描述 符 fd[1] 的 ASCII[ 表 示 形 式 作为 一 个 参数 传送 给 服务 
器 进程 。) 

父 进 程 将 包含 路 径 名 和 打开 模式 的 请 求 发 送 给 服务 器 进程 
后 ， 父 进程 调用 recv_fq 返 回 描述 符 或 出 错 消 息 。 如 果 服 务 器 进程 返 
出 错 消 息 ， 那 么 父 进程 调用 write， 癌 标准 错误 输出 该 消息 。 

现在 ， 让 我 们 来 看 看 open 服 务 器 进程 。 其 程序 是 opend， 由 图 17-19 
中 的 子 进程 执行 。 首 先 ， 要 有 一 个 opend.h 头 文件 ( 见 图 17-20) ， 它 包 
括 标准 头 文 件 ， 并 且 声 明了 全 局 变量 和 男 数 原型 。 


I| s 


#include "apue.h" 
#include <errno.h> 


#define CL_OPEN "open" /* client's request for server */ 

extern char errmsg[]; /* error message string to return to client */ 
extern int oflag; p*-open() flags xxx... Y 

extern char  *pathname; /* of file to open() for client */ 

int cdi. args:(int, «char **)5 


void handle_request(char *, int, int); 


图 17-20 opend.h3 X fF 
main 函数 〈 见 图 17-21) 经 fd 管道 ( 它 的 标准 输入 ) 读 来 自 客 户 进 
程 的 请 求 ， 然 后 调用 函数 handle_request。 


#include "opend.h" 
char errmsg [MAXLINE]; 
int oflag; 

char *pathname; 


int 
main (void) 


{ 


int nread; 
char buf [MAXLINE] ; 
for (; ; ) {/* read arg buffer from client, process request */ 


if ((nread = read(STDIN_FILENO, buf, MAXLINE)) < 0) 
err_sys("read error on stream pipe"); 
else if (nread == 0) 
break; /* client has closed the stream pipe */ 
handle_request (buf, nread, STDOUT_FILENO) ; 
} 
exit (0); 


图 17-21 服务 器 进程 main 函 数 第 1 版 


图 17-22 中 的 handle request Ex Zt zK 3H. T SHE TL fe 9 € Val Fg ER BY 
buf_args 将 客户 进程 请 求 分 解 成 标准 argv 型 的 参数 表 ， 人 然后 调用 函数 
cli_args 处 理 客户 进程 的 参数 。 如 果 一 切 正常 ， 则 调用 open 打 开 相应 文 
件 ， 接 着 调用 send_fd， 经 由 fd 管道 ( 它 的 标准 输出 ) 将 描述 符 回 送 给 
客户 进程 。 如 果 出 错 则 调用 send_err 回 送 一 则 出 错 消息 ， 其 中 使 用 了 前 
面 说 明 的 客户 进程 -服务 硕 进 程 协议 。 


#include "opend.h" 
#include «fcntl.h» 


void 
handle request(char *buf, int nread, int fd) 
( 


int newfd; 


if (buf[nread-1] != 0) { 
snprintf(errmsg, MAXLINE-1, 
"request not null terminated: %*.*s\n", nread, nread, buf); 
send err(fd, -1, errmsg); 
return; 
} 
if (buf_args (buf, cli args) < 0) ( /* parse args & set options */ 
send err(fd, -1, errmsg); 
return; 
} 
if ((newfd = open(pathname, oflag)) < 0) { 
snprintf (errmsg, MAXLINE-1, "can't open %s: %s\n", pathname, 
strerror(errno)); 
send err(fd, -1, errmsg); 
return; 
) 
if (send fd(fd, newfd) « 0) /* send the descriptor */ 
err sys("send fd error"); 
close (newfd); /* we're done with descriptor */ 


图 17-22 handle requestÉR Zi 8 1h 


客户 进程 请 求 是 一 个 以 null 终止 的 字符 串 ， 它 包含 由 空格 分 隔 的 
参数 。 图 17-23 中 的 buf_args 函 数 将 字符 串 分 解 成 标准 argv 型 参数 表 ， 
并 调用 用 户 函 数 处 理 参 数 。 我 们 使 用 ISO CERZstrtok FE FIFE op Hl BA 


立 的 参数 。 


#include "apue.h" 


#define MAXARGC 50 /* max number of arguments in buf */ 
#define WHITE "\t\n" /* white space for tokenizing arguments */ 
/* 


* buf[] contains white-space-separated arguments. We convert it to an 
* argv-style array of pointers, and call the user's function (optfunc) 
* to process the array. We return -1 if there's a problem parsing buf, 
* else we return whatever optfunc() returns. Note that user's buf[] 
* array is modified (nulls placed after each token). 
a 

int 

buf_args(char *buf, int (*optfunc) (int, char **)) 

{ 


char *ptr, *argv[MAXARGC]; 
int argc; 
if (strtok(buf, WHITE) -- NULL) /* an argv[0] is required */ 


return(-1); 
argv[argc = 0] = buf; 
while ((ptr = strtok(NULL, WHITE)) != NULL) { 

if (++argc >= MAXARGC-1) /* -1 for room for NULL at end */ 

return(-1); 

argv[argc] = ptr; 
} 
argv[**argc] = NULL; 


/* 

* Since argv[] pointers point into the user's buf[], 
* user's function can just copy the pointers, even 
* though argv[] array will disappear on return. 

wy 

return((*optfunc) (argc, argv)); 


图 17-23 buf. args ER ZA 


buf_args 调 用 的 服务 器 进程 函数 是 cli_args ( 见 图 17-24) 。 它 验证 
客户 进程 发 送 的 参数 个 数 是 否 正 确 ， 然 后 将 路 径 名 和 打开 模式 存储 在 


全 局 变量 中 。 


#include "opend.h" 


/* 

* This function is called by buf args(), which is called by 
* handle request(). buf args() has broken up the client's 
* buffer into an argv[]-style array, which we now process. 
E 

int 


cli.args (int argc, char **argv) 
{ 
if (argc != 3 || strcmp(argv[0], CL OPEN) != 0) { 
strcpy (errmsg, "usage: <pathname> <oflag>\n"); 
return (-1):; 


pathname = argv[1]; /* save ptr to pathname to open */ 
oflag = atoi(argv[2]); 
return (0); 


图 17-24 cli argsER Zt 


这 样 也 就 完成 了 open 服 务 器 进程 ， 它 由 客户 进程 执行 fork 和 exec 来 
调用 。 在 fork 之 前 创建 了 一 个 fd 管道 ， 然 后 客户 进程 和 服务 器 进程 用 其 
进行 通信 。 在 这 种 安排 下 ， 每 个 客户 进程 都 有 一 个 服务 器 进程 。 


17.6 open 服 务 句 进程 第 2 版 


在 上 一 万 中 ， 我 们 开发 了 一 个 open 服 务 器 进程 ， 由 客户 进程 执行 
fork 和 exec 调 用 ， 它 说 明了 如 何 从 子 程序 向 父 程序 传送 文件 描述 符 。 本 
节 将 开发 一 个 守护 进程 方式 的 open 服务 器 进程 。 一 个 服务 絮 进 程 处 理 
所 有 客户 进程 的 请 求 。 由 于 避免 了 使 用 fork 和 exec， 我 们 期 望 这 个 设 
计 会 更 有 效 。 在 客户 进程 和 服务 器 进程 之 间 仍 使 用 UNIX 域 套 接 字 连 
接 ， 并 用 实例 说 明 在 两 个 无 天 进程 之 间 如 何 传送 文件 描述 符 。 我 们 将 
使 用 17.3 P5 LAB 3 SEHR: serv_listen、serv_accept 和 cli_conn。 这 个 


服务 器 进程 还 将 演示 一 个 服务 器 进程 如 何 处 理 多 个 客户 进程 ， 为 此 要 
用 到 14.4 下 中 说 明 的 select 和 poll 函 数 。 

本 节 所 述 的 客户 进程 类 似 于 17.5 节 中 的 客户 进程 。 实 际 上 ， 文 件 
main.c 是 完全 相同 的 〈 见 图 17-18) 。 我 们 将 在 open.h 头 文件 〈 见 图 17- 
17) 中 加 入 下 面 这 行 : 

#define CS. OPEN "/tmp/opend.socket" /* server's well-known name */ 

因为 在 此 例 中 调用 的 是 cli_conn 而 非 fork 和 exec， 所 以 文件 open.c 与 
图 17-19 中 的 不 同 。 修 改 后 如 图 17-25 所 示 。 


#include "open.h" 
#include <sys/uio.h> /* struct iovec */ 
/* 


* Open the file by sending the "name" and "oflag" to the 
* connection server and reading a file descriptor back. 
A 

int 

csopen(char *name, int oflag) 


( 


int len; 

char buf[12]; 

struct iovec iov[3]; 

static int csfd = -1; 

if festa. cq) /* open connection to conn server */ 


if ((csfd = cli conn(CS OPEN)) « 0) { 
err ret("cli conn error"); 
return (-1); 


} 


sprintf(buf; " &d', oflag); /*''oflag to ascii, wy 


iov[0].iov base = CL OPEN " "; /* string concatenation */ 
iov[0].iov len = strlen(CL OPEN) + 1; 

iov[1].iov base = name; 

iov[1].iov len = strlen(name); 

iov[2].iov base = buf; 

iov[2].iov len = strlen(buf) + 1; /* null always sent */ 
len = iov[0].iov len + iov[1].iov len + iov[2].iov len; 
if (writev(csfd, &iov[0], 3) != len) { 


err ret("writev error"); 


return(-1); 


/* read back descriptor; returned errors handled by write() */ 


return(recv fd(csfd, write)); 


117-25 csopen EN Zi 2h 

客户 进程 与 服务 器 进程 之 间 使 用 的 协议 仍然 相同 。 

接 下 来 再 看 服务 器 进程 。 头 文件 opend.h 〈 见 图 17-26) 包括 了 标准 
头 文件 ， 并 且 声 明了 全 局 变量 和 函数 原型 。 


#include "apue.h" 
#include <errno.h> 


#define CS_OPEN "/tmp/opend.socket" /* well-known name */ 
#define CL_OPEN "open" /* client's request for server */ 
extern int debug; /* nonzero if interactive (not daemon) */ 
extern char errmsg[]; /* error message string to return to client */ 
extern int oflag; /* open flag: © xxx :.. */ 
extern char  *pathname; /* of file to open for client */ 
typedef struct { /* one Client struct per connected client */ 
irit fd; /* fd, or -1 if available */ 
uidit wads 
) Client; 
extern Client*client; /* ptr to malloc'ed array */ 
extern int client size; /* # entries in client[] array */ 
int cli args (int; char **); 
int client add(int, uid t); 
void client del(int); 
void loop(void); 
void handle request(char *, int, int, uid t); 


图 17-26 opend.h 头 文件 第 2 版 
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进程 连接 的 状态 。 这 是 用 在 opend.h 头 文件 中 声明 的 client 数 组 实现 的 。 
图 17-27 定 义 了 3 个 处 理 此 数组 的 函数 。 


#include "opend.h" 


#define NALLOC 10 /* # client structs to alloc/realloc for */ 


static void 


client alloc (void) /* alloc more entries in the client[] array */ 
( 
int iy 
if (client == NULL) 
client = malloc(NALLOC * sizeof(Client)); 
else 


client = realloc (client, (client_size+NALLOC) *sizeof (Client) ); 
if (client == NULL) 
err sys ("can't alloc for client array"); 


/* initialize the new entries */ 
for (i = client size; i < client size + NALLOC; i++) 
client[i].fd = -1; /* fd of -1 means entry available */ 


client size += NALLOC; 


/* 
* Called by loop() when connection request from a new client arrives. 
X 
int 

client add(int fd, uid t uid) 

{ 


int i 
if (client -- NULL) /* first time we're called */ 
client alloc(); 
again: 
for (i = 0; i < client size; i++) { 


if (client[i].fd == -1) { /* find an available entry */ 
client[i].fd = fd; 
client[i].uid = uid; 
return(i);/* return index in client[] array */ 


/* client array full, time to realloc for more */ 
client_alloc(); 


goto again; /* and search again (will work this time) */ 
} 
/* 
* Called by loop() when we're done with a client. 
*/ 
void 


client del(int fd) 
( 


int is 


for (i = 0; i < client size; i++) { 
if (client[i].fd == fd) { 
client[i].fd = -1; 
return; 


} 
} 
log_quit ("can't find client entry for fd sar, fd); 


图 17-27 处 理 dient 数 组 的 3 个 函数 


第 一 次 调用 dlient_add 时 ， 它 调用 dlient_alloc，dlient_alloc 又 调用 
malloc 为 该 数组 的 10 个 登记 项 分 配 空间 。 在 这 10 个 登记 项 全 部 用 完 后 ， 
如 若 再 调用 client_add， 那 么 client_alloc 函 数 将 调用 realloc 来 分 配 附 加 空 
间 。 依 靠 这 种 动态 空间 分 配 ， 我 们 无 需 在 编译 时 将 估计 的 数组 长 度 值 
放 入 头 文件 中 从 而 限制 client 数 组 的 长 度 。 如 果 出 错 ， 这 些 函 数 将 调用 
log Kt ( 见 附录 B) ， 因 为 我 们 假定 服务 器 进程 是 守护 进程 。 

通常 服务 絮 进 程 会 作为 守护 进程 运行 ， 但 我 们 想 提供 一 个 让 其 前 
台 运 行 的 选项 ， 同 时 能 够 把 分 析 信 息 发 送 到 标准 销 误 和 输出。 这 应 该 能 
使 服务 器 更 容易 评测 和 调试 ， 特 别 是 当 用 户 没有 权限 读 取 那些 分 析 信 
居 经 党 写 入 的 日 志文 件 时 。 可 以 使 用 一 个 命令 行 选项 来 控制 服务 名 是 
否 在 前 台 运 行 或 者 作为 守护 进程 在 后 台 运 行 。 

一 个 系统 的 所 有 命令 遵循 相同 的 约定 是 非常 重要 的 ， 因 为 这 会 提 
高 它 的 易 用 性 。 如 果 有 人 吕 悉 某 条 命令 的 选项 风格 ， 那 么 肴 后 面 的 命 
令 使 用 了 其 他 的 风格 ， 他 就 很 容易 犯错 。 

处 理 命令 行 空 格 就 很 容易 发 生 这 样 的 问题 。 有 些 命令 需要 它 的 选 
项 和 其 参数 以 空格 隔 开 ， 而 另 一 些 则 希望 它 的 参数 直接 跟 在 它 的 选项 
之 后 。 如 宁 没 有 遭 循 一 个 一 致 昌 规则， 用 户 吏 得 记 住 所 有 命令 的 语 
法 ， 或 者 在 尝试 和 调 错 中 调用 这 些 命令 。 

Single UNIX Specification 包 括 了 一 系列 的 约定 和 规范 来 保证 命令 行 
语法 的 一 致 性 ， 其 中 包括 一 些 建议 ， 如 “限制 每 个 命令 行 选项 为 一 个 单 
一 的 阿拉 人 字符 ”以 及 “所 有 选项 必须 以 一 ' 作 为 开头 字符 ”。 

对 运 的 是 ，getopt 函 数 能 够 帮助 命令 开发 者 以 一 致 的 方式 处 理 命令 
行 选 项 。 


#include <unistd.h> 

int getopt(int argc, char * const argv[], const char *options); 

extern int optind, opterr, optopt; 

extern char *optarg; 

返回 值 : 春 所 有 选项 被 处 理 完 ， 返 回 -1; d, RID Re 

参数 argc 和 argv 与 传 和 main 函数 的 一 样 。options 参 数 是 一 个 包含 
命令 文 持 的 选项 字符 的 字符 串 。 coe LS NU 
号 ， 则 表示 该 选项 需要 参数 ; 否则 ， 该 选项 不 需要 额外 参数 。 "m 
说 ， 如 有 果 一 条 命令 的 用 法 说 明 如 下 : 

command [-i] [-u username] [-z] filename 

则 我 们 可 以 给 getopt 传 送 一 个 "iu:z" 作 为 options 字 人 符 串 。 

函数 getopt 一 般 用 在 循环 体内 ， 循 环 直 到 getopt 返 回 -1 时 退出 。 每 次 
和 欠 代 中 ，getopt 会 返回 下 一 个 选项 。 应 用 程序 负责 筛选 这 些 选 项 ， 判 断 
是 否 有 冲突 ，getopt 仅 负 责 解 释 选 项 并 保证 一 个 标准 的 格式 。 

当 遇 到 无 效 的 选项 时 ，getopt 返 回 一 个 问题 标记 (question mark) 
而 不 是 这 个 字符 。 如 果 选 项 缺少 参数 ，getopt 也 会 返回 一 个 问题 标记 ， 
但 如 条 选项 字符 串 的 第 一 个 字符 是 冒号 ，getopt 会 直接 返回 冒号 。 而 特 
殊 的 “--” 格 式 则 会 导致 getopt 停 止 处 理 选 项 并 返回 -1。 这 允许 用 户 传递 
以 “-” 开 头 但 不 是 选项 的 参数 。 例 如 ， 如 果 有 一 个 名 字 为 “-bar” 的 文件 ， 
下 面 的 命令 行 是 无 法 删除 这 个 文件 的 : 

rm —bar 

因为 rm 会 试图 把 -bar 解 释 为 选项 。 正 确 的 删除 文件 的 命令 应 该 是 : 

rm -- -bar 

getopt 函 数 支 持 以 下 4 个 外 部 变量 。 

optarg 如 果 一 个 选项 需要 参数 ， 在 处 理 该 选项 时 ，getopt 会 设置 
optarg 指 回 该 选项 的 参数 字符 串 。 


opter 如 果 一 个 选项 发 生 了 错误 ，getopt 会 默认 打印 一 条 出 错 消 
轧 。 应 用 程序 可 以 通过 设置 opterr 参 数 为 0 来 禁止 这 个 行为 。 

optind 用 来 存放 下 一 个 要 处 理 的 字符 串 在 argv 数 组 里 的 下 标 。 它 从 
1 开始 ， 每 处 理 一 个 参数 ，getopt 都 会 对 其 递增 1 。 

optopt 如 有 果 处 理 选 项 时 发 生 了 错误 ，getopt 会 设置 optopt 指 辐 导 致 出 
错 的 选项 字符 串 。 

openHlk4S 283tfzfJmainERZ& ( 见 图 17-28) 定义 全 局 变量 ， 处 理 命 
令 行 选项 ， 并 且 调 用 loop 函 数 。 如 果 以 -d 选 项 调用 服务 妖 进 程 ， 则 服务 
给 进程 将 以 交互 方式 运行 而 非 守护 进程 方式 。 测 试 服务 硕 进 程 时 会 用 
到 这 个 选项 。 


#include "opend.h" 
finclude <syslog.h> 


int debug, oflag, client_size, log_to_stderr; 
char errmsg [MAXLINE] ; 

char *pathname; 

Client *client = NULL; 


int 
main(int argc, char *argv[]) 


{ 


int CF 


log open("open.serv", LOG PID, LOG USER); 


opterr - 0; /* don't want getopt() writing to stderr */ 
while ((c = getopt (argc, argv, "d")) != EOF) { 
switch (c) { 
case 'd': /* debug */ 
debug = log_to_stderr = 1; 
break; 
case '?': 
err quit ("unrecognized option: -$c", optopt); 


} 
} 


if (debug == 0) 
daemonize ("opend") ; 


loop (); /* never returns */ 


图 17-28 服务 器 进程 main 函 数 第 2 版 

loop 函 数 是 服务 器 进程 的 无 限 循 环 。 我 们 将 给 出 该 函数 的 两 种 版 
本 。 图 17-29 是 使 用 select 的 一 种 版 本 。 图 17-30 所 示 的 程序 是 使 用 poll 的 
另 一 种 版 本 。 


#include "opend.h" 
#include <sys/select.h> 


void 
loop (void) 
{ 


int i, n, maxfd, maxi, listenfd, clifd, nread; 
char buf [MAXLINE] ; 
uid t uid; 


fd set rset, allset; 


FD ZERO(&allset); 


/* obtain fd to listen for client requests on */ 
if ((listenfd = serv listen(CS OPEN)) « 0) 
log sys("serv listen error"); 
FD SET(listenfd, &allset); 
maxfd - listenfd; 
maxi - -1; 


for (8a) 
rset = allset; /* rset gets modified each time around */ 
if ((n = select(maxfd + 1, &rset, NULL, NULL, NULL)) « 0) 
log sys("select error"); 


if (FD ISSET(listenfd, &rset)) { 

/* accept new client request */ 

if ((clifd = serv accept(listenfd, &uid)) < 0) 
log sys("serv accept error: $d", clifd); 

i = client add(clifd, uid); 

FD SET(clifd, &allset); 

if (clifd » maxfd) 
maxfd = clifd; /* max fd for select() */ 

if (i » maxi) 


maxi = iy /* max index in client[] array */ 
log msg("new connection: uid $d, fd $d", uid, clifd); 
continue; 
) 
for (i = 0; i <= maxi; i++) ( /* go through client[] array */ 
if ((clifd = client[i].fd) < 0) 
continue; 


if (FD ISSET(clifd, &rset)) { 
/* read argument buffer from client */ 
if ((nread = read(clifd, buf, MAXLINE)) « 0) { 
log sys("read error on fd $d", clifd); 
) else if (nread == 0) { 
log msg("closed: uid $d, fd %d", 
client[i].uid, clifd); 
client del(clifd);/* client has closed cxn */ 
FD CLR(clifd, &allset); 
close (clifd); 


117-29 使 用 select 的 loop 范 数 


此 函数 调用 serv_listen ( 见 图 17-8) 创建 服务 器 进程 与 客户 进程 连 
接 的 端点 。 此 函数 的 其 余部 分 是 一 个 循环 ， 它 从 select 调用 开始 。 在 
select 返回 后 ， 可 能 会 发 生 下 面 两 种 情况 。 

(1) 描述 符 listenfd 可 以 随时 读 取 ， 这 意味 着 一 个 新 客户 进程 已 调 
用 了 cli conn。 为 了 处 理 这 种 情况 ， 我 们 将 调用 serv_accept ( 见 图 17- 
9) ， 然 后 为 新 客户 进程 更 新 client 数 组 以 及 与 该 新 客户 进程 相关 的 短 记 
FA. (我 们 要 跟踪 select 的 第 一 个 参数 的 最 高 描述 符 编 号 ， 还 要 跟踪 
使 用 中 的 dient 数 组 的 最 高 下 标 。) 
(2) 一 个 现 有 的 客户 进程 的 连接 可 以 随时 读 取 。 这 意味 着 该 客户 
进程 已 经 终止 ， 或 者 该 客户 进程 已 发 送 一 个 新 请 求 。 如 果 read 返 回 0 
(文件 结束 ) ， 则 表示 客户 进程 已 终止 。 如 果 read 返 回 的 值 大 于 0， 则 
表示 有 一 个 新 请 求 需 处 理 ， 可 以 调用 request 来 处 理 。 

用 allset 摘 述 符 集 跟 踩 当前 使 用 的 描述 符 。 当 新 客户 进程 连接 至 服 
务 狼 进程 时 ， 会 打开 此 描述 符 集 的 相应 位 。 当 该 客户 进程 终止 时 ， 会 
天 闭 相 应 位 。 

因为 客户 进程 的 所 有 描述 符 都 由 内 核 自 动 天 闭 (包括 与 服务 器 进 
程 的 连接 ) ， 所 以 我 们 总 能 知道 什么 时 候 客户 进程 终止 了 ， 该 终止 是 
否 是 自愿 的 。 这 与 XSIIPC 机 制 不 同 。 

fit FH poll ENB loop EN BLAU Ed 17-3075 ° 


#include "opend.h" 
#include <poll.h> 


#define NALLOC 10 /* # pollfd structs to alloc/realloc */ 
Static struct pollfd.* 


grow pollfd(struct pollfd *pfd, int *maxfd) 
{ 


int i; 

int oldmax = *maxfd; 

int newmax = oldmax + NALLOC; 

if ((pfd = realloc(pfd, newmax * sizeof(struct pollfd))) == NULL) 


err_sys("realloc error"); 

for (i = oldmax; i < newmax; i++) { 
PEd[lilsfd e = 
pfd[i].events = POLLIN; 
pfd[i].revents = 0; 

} 

*maxfd = newmax; 

return (pfd); 


void 
loop (void) 


int i, listenfd, clifd, nread; 


char buf [MAXLINE]; 

uid t uid; 

struct pollfd *pollfd; 

int numfd = 1; 

int maxfd = NALLOC; 

if ((pollfd = malloc(NALLOC * sizeof(struct pollfd))) == NULL) 


err sys("malloc error"); 
for (i = 0; i « NALLOC; i++) ( 
pollfd[i].fd = -1; 
pollfd[i].events - POLLIN; 
pollfd[i].revents - 0; 


/* obtain fd to listen for client requests on */ 
if ((listenfd = serv listen(CS OPEN)) « 0) 
log sys("serv listen error"); 
client add(listenfd, 0); /* we use [0] for listenfd */ 
pollfd[0].fd = listenfd; 


for iC > 7) 4 
if (poll(pollfd, numfd, -1) < 0) 
log_sys ("poll error"); 


if (pollfd[0].revents & POLLIN) { 
/* accept new client request */ 
if ((clifd = serv accept(listenfd, &uid)) < 0) 
log_sys("serv_accept error: %d", clifd); 
client_add(clifd, uid); 


/* possibly increase the size of the pollfd array */ 
if (numfd == maxfd) 
pollfd = grow pollfd(pollfd, &maxfd); 
pollfd[numfd].fd = clifd; 
pollfd[numfd].events = POLLIN; 
pollfd[numfd].revents = 0; 
numfd++; 
log msg("new connection: uid %d, fd $d", uid, clifd); 


for (i = 1; i < numfd; i++) { 
if (pollfd[i].revents & POLLHUP) { 
goto hungup; 
} else if (pollfd[i].revents & POLLIN) { 
/* read argument buffer from client */ 
if ((nread = read(pollfd[i].fd, buf, MAXLINE)) « 0) 
log sys("read error on fd $d", pollfd[i].fd); 
) else if (nread == 0) { 
hungup: 
/* the client closed the connection */ 
log msg("closed: uid $d, fd $d", 
client[i].uid, pollfd[i].fd); 
client del(pollfd[i].fd); 


close (pollfd[i].fd); 

if (i < (numfd-1)) { 
/* pack the array */ 
pollfd[i].fd = pollfd[numfd-1].fd; 
pollfd[i].events = pollfd[numfd-1].events; 
pollfd[i].revents = pollfd[numfd-1].revents; 
i=; /* recheck this entry */ 

} 

numfd--; 

) else ( /* process client's request */ 
handle request(buf, nread, pollfd[i].fd, 
client[i].uid); 


图 17-30 使 用 poll 的 loop 函 数 

为 使 打开 描述 符 的 数量 能 与 客户 进程 数量 相当 ， 我 们 动态 地 为 
pollfd 结 构 的 数字 分 配 空间 ， 所 使 用 的 策略 与 client_alloc 函 数 分 配 client 
数组 ( 见 图 17-27) 时 所 使 用 的 相同 。 

pollfd 数 组 中 的 第 一 个 登记 项 (下 标号 为 0) 用 于 listenfd 描 述 符 。 
新 客户 进程 连接 的 到 达 由 listenfd 描 述 符 中 的 POLLIN 指 示 。 如 同 前 述 ， 
调用 serv_accept 来 接受 该 连接 。 

对 于 一 个 现 有 的 客户 进程 ， 应 当 处 理 来 目 poll 的 两 个 不 同事 件 : 由 
POLLHUP 指 示 的 客户 进程 终止 ， 由 POLLIN 指 示 的 来 自 现 有 客户 进程 
的 一 个 新 请 求 。 即 使 连接 的 服务 器 端 还 在 读 取 数据 ， 和 客户 端 也 能 够 天 
财 它 这 端的 连接 。 即 使 连接 购 一 端 已 经 被 标记 为 挂 起 状态 ， 服 务 需 仍 
然 可 以 读 取 在 它 那 端 队列 里 的 数据 。 当 然 ， 服 务 器 在 收 到 客户 端的 挂 
起 消息 时 用 close 天 闭 到 客户 问 的 连接 ， 可 有 效 地 抛弃 所 有 队列 里 的 数 
据 。 剩 下 的 请 求 也 没 必要 处 理 ， 因 为 我 们 已 经 无 法 发 回 啊 应 的 信息 。 

如 同 此 函数 的 select 版 本 ， 调 用 request 函 数 ( 见 图 17-31) 处 理 来 自 
客户 进程 的 新 请 求 。 此 函数 类 似 于 其 早期 版 本 〈 见 图 17-22) 。 它 调用 
同一 函数 buf_args ( 见 图 17-23) ，buf_args 叉 调用 dli_args ( 见 图 17- 


24) ， 但 是 ， 因 为 它 是 在 一 个 守护 进程 中 运行 的 ， 所 以 它 在 日 志文 件 
中 记录 出 错 消 轧 ， 而 不 是 在 标准 错误 上 打印 它们 。 


#include "opend.h" 
#include «fcntl.h» 
void 


handle request(char *buf, int nread, int clifd, uid t uid) 


( 


int newfd; 


if (buf[nread-1] != 0) { 
snprintf (errmsg, MAXLINE-1, 
"request from uid $d not null terminated: %*.*s\n", 
uid, nread, nread, buf); 
send err(clifd, -1, errmsg); 
return; 
} 


log msg("request: %s, from uid %d", buf, uid); 


/* parse the arguments, set options */ 
if (buf args(buf, cli args) « 0) { 
send err(clifd, -1, errmsg); 
log msg (errmsg); 
return; 


H- 


f ((newfd = open (pathname, oflag)) < 0) { 
snprintf (errmsg, MAXLINE-1, "can't open %s: %s\n", 


pathname, strerror(errno)); 
send err(clifd, -1, errmsg); 
log msg (errmsg) ; 
return; 


) 


/* send the descriptor */ 
if (send fd(clifd, newfd) « 0) 
log sys("send fd error"); 
log msg("sent fd $d over fd $d for $s", newfd, clifd, pathname); 
close (newfd); /* we're done with descriptor */ 


图 17-31 request K Zt 
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了 所 有 的 客户 进程 请 求 。 


17.7 小 结 


本 章 的 关键 点 是 如 何在 两 个 进程 之 间 传 送 文件 描述 符 ， 以 及 服务 
器 进程 如 何 接受 来 自 客 户 进程 的 唯一 连接 。 虽 然 所 有 平台 都 文 持 UNIX 
域 套 接 字 〈 见 图 15-1) ， 但 是 各 种 实现 都 有 不 同 之 处 ， 这 使 我 们 很 难 开 
发 可 移植 的 应 用 程序 。 

整 章 都 使 用 了 UNIX 域 套 接 字 。 我 们 了 解 了 如 何 用 它们 来 实现 一 个 
全 双 工 的 管道 以 及 如 何 利 用 它们 来 适应 14.4 节 的 IO 多 路 转 接 函 数 以 间 
接地 用 于 XSI 消 息 队 列 中 。 

本 章 给 出 了 open 服 务 器 进程 的 两 个 版 本 。 一 个 版 本 由 客户 进程 用 
fork 和 exec 直 接 调用 ， 另 一 版 本 是 一 个 守护 服务 器 进程 处 理 所 有 窗户 进 
程 请 求 。 这 两 个 版 本 均 采 用 文件 摘 述 符 传 送 和 接收 函数 。 

我 们 还 展示 了 如 何 使 用 getopt 函数 来 保证 命令 行 参数 处 理 的 一 致 
TE © RAI open 服务 器 进程 版 本 使 用 了 getopt 芳 数 、17.3 广 中 引入 的 客 
户 进程 -服务 器 进程 连接 函数 和 14.4 节 中 的 1/O 多 路 转 接 函数 。 


习题 


17.1 我 们 选择 使 用 图 17-3 中 的 UNIX 域 数据 报 套 接 字 ， 因 为 它们 能 
够 保留 消息 边界 。 摘 述 如 果 使 用 常规 的 管道 实现 需要 哪些 必要 的 改 
动 。 我 们 应 当 如 何 避 免 额 外 的 两 次 消息 复制 呢 ? 

17.2 使 用 本 章 描述 的 文件 描述 符 传 送 函 数 以 及 8.9 市 中 描述 的 父 进 
程 和 子 进程 同步 例 程 ， 编 写 具有 下 列 功能 的 程序 。 该 程序 调用 fork， 子 
进程 打开 一 个 现 有 的 文件 并 将 打开 文件 描述 符 传 送 给 父 进程 。 然 后 ， 
子 进程 调用 lseek 确 定 该 文件 的 当前 读 、 写 位 置 ， 通 知 父 进 程 。 父 进程 


读 该 文件 的 当前 偏 移 量 ， 并 打印 它 以 便 验证 。 若 此 文件 按 上 述 方式 从 
子 进程 传 弟 到 父 进程 ， 则 父 进程 和 子 进程 应 共享 同一 个 文件 表 项 ， 所 
以 当 子 进程 每 次 更 改 该 文件 当前 偏 移 量 时 ， 这 种 更 改 应 该 也 会 影响 父 
进程 的 描述 符 。 使 子 进程 将 该 文件 定位 至 一 个 不 同 偏 移 量 ， 并 再 次 通 
知 父 进程 。 

17.3 图 17-20 和 图 17-21 中 的 程序 分 别 定义 和 声明 了 全 局 变量 ， 两 者 
的 区 别 是 什么 ? 

17.4 改写 buf_args 函 数 〈 见 图 17-23) ， 删 除 其 中 对 argv 数 组 长 度 的 
编译 时 限制 。 请 用 动态 存储 分 配 。 

17.5 描述 优化 图 17-29 和 图 17-30 中 的 loop 函 数 的 方法 ， 并 实现 之 。 

17.6 f£serv listenE4 Zt. 〈 见 图 17-8) 中 ， 如 果 文 件 已 经 存在 ， 我 们 
要 先 对 代表 UNIX 域 套 接 字 的 文件 名 解除 链接 。 为 了 防止 误 删 除 不 是 套 
接 字 的 文件 ， 我 们 可 以 先 调用 stat 来 验证 文件 类 型 。 解 释 这 种 做 法 存在 
的 两 个 问题 。 

17.7 请 给 出 两 种 可 能 的 方法 ， 使 得 单 次 调用 sendmsg 可 以 传递 多 个 
文件 描述 符 。 尝 试 实现 你 的 方法 并 验证 你 的 操作 系统 是 否 支 持 这 样 的 
pa ® 
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18.1 引言 


无 论 在 哪 种 操作 系统 中 ， 终 端 VO 的 处 理 都 是 非常 繁琐 的 一 部 分 ， 
UNIX 系统 也 不 例外 。 在 大 多 数 版 本 的 编程 手册 中 ， 终 端 VO 手 册页 常 
常 是 最 长 的 几 个 部 分 之 一 。 

在 20 世 纪 70 年 代 后 期 ， 系 统 员 在 V7 的 基础 上 发 展 出 一 套 不 同 的 终 
端 例 程 ， 由 此 使 得 UNIX 终 端 UO 处 理 分 立 为 两 种 不 同 的 风格 。 一 种 是 
ASMA KAS, H System V 沿 续 下 来 ， 男 一 种 是 V7 的 风格 ， 它 成 为 
BSD 派 生 的 系统 终端 IO 处 理 的 标准 。 如 同 信号 一 样 ，POSIX.1 在 这 两 
种 风格 的 基础 上 制定 了 终端 IO 标准 。 本 章 将 介绍 POSIX.1 的 所 有 终端 
函数 ， 以 及 某 些 平台 特有 的 增加 部 分 。 

终端 IO 系统 之 所 以 如 此 复杂 ， 部 分 原因 是 人 们 将 其 应 用 在 众多 的 
事物 上 : 终端 、 计 算 机 之 间 的 直接 连接 、 调 制 解 调 器 以 及 打印 机 等 。 


18.2 Few 


imo A PA RAN IRI LIEBE ° 
(1) 规范 模式 输入 处 理 。 在 这 种 模式 中 ， 对 终端 输入 以 行为 单位 
进行 处 理 。 对 于 每 个 读 请 求 ， 终 端 驱 动 程序 最 多 返回 一 行 。 


(2) 非 规范 模式 输入 处 理 。 输 入 字符 不 装配 成 行 。 

如 有 果 不 做 特殊 处 理 ， 则 默认 模式 是 规范 模式 。 例 如 ， 若 shell 将 标 
准 输入 重 定向 到 终端 ， 并 用 read 和 write 将 标准 输入 复制 到 标准 输出 ， 则 
终端 以 规范 模式 进行 工作 ， 每 次 read 最 多 返回 一 行 。 处 理 整 个 屏幕 的 程 
HF (如 vi 编辑 器 ) 使 用 非 规范 模式 ， 原 因 是 它 的 命令 可 能 是 由 单个 字 
从 组 成 的 ， 并 旦 不 以 换行 符 终止 。 男 外 ， 该 编辑 器 并 不 希望 系统 对 特 
殊 字 符 进 行 处 理 ， 因 为 这 些 字符 很 可 能 与 编辑 命令 中 使 用 的 字符 重 
车。 例如 ，Ctrl+D 字 符 通常 是 终端 的 文件 结束 符 ， 但 在 vi 中 它 是 向 下 演 
动 半 个 屏幕 的 命令 。 

V7 和 较 早 的 BSD 风 格 类 的 终端 驱动 程序 支持 3 种 终端 输入 模式 : 
(a) 精细 加 工 模式 (输入 装配 成 行 ， 并 对 特殊 字符 进行 处 理 ) ; 
(b) 原始 模式 (输入 不 装配 成 行 ， 也 不 对 特殊 字符 进行 处 理 ) ; 
(c) cbreak 模 式 (输入 不 装配 成 行 ， 但 对 某 些 特殊 字符 进行 处 理 ) 
图 18-20 显 示 了 将 终端 设置 为 cbreak 或 原始 模式 的 POSIX.1 函 数 。 

POSIX.1 定 义 了 11 个 特殊 输入 字符 ， 其 中 9 个 可 以 更 改 。 本 书 已 经 
用 到 了 其 中 几 个 ， 例 如 文件 结束 符 (通常 是 Ctrl+D) 和 挂 起 字符 (通常 
是 Ctrl+Z) 。18.3 贡 将 对 这 些 字符 逐一 进行 说 明 。 

可 以 认为 终端 设备 是 由 通常 位 于 内 核 中 的 终端 驱动 程序 控制 的 。 
每 个 终端 设备 都 有 一 个 输入 队列 和 一 个 输出 队列 ， 如 图 18-1 所 示 。 


o 


进程 写 的 下 一 个 字符 进程 读 的 下 一 个 字符 
| "— | a 如 果 打 开 回 显 功能 | 输入 队列 
| MAX INPUT ——» 
传送 到 设备 的 从 设备 中 读 取 的 
下 一 个 字符 下 一 个 字符 


18-1 终端 设备 的 输入 、 输 出 队列 的 逻辑 结构 


XJ EG PS EUH DÀ P JL, ° 

“如 采 打 开 了 回 显 功 能 ， 则 在 输入 队列 和 输出 队列 之 间 有 一 个 隐 合 
的 连接 。 

“输入 队列 的 长 度 MAX_INPUT 〈 见 图 2-11) 是 有 限 值 。 当 一 个 特 
定 设 备 的 输入 队列 已 经 填 满 时 ， 系 统 的 行为 将 依赖 于 实现 。 这 种 情况 
发 生 时 大 多 数 UNIX 系 统 回 显 响 铃 字符 o 

图 中 没有 显示 男 一 个 输入 限制 MAX_CANON。 这 个 限制 是 一 个 
规 苑 输入 行 的 最 大 字 下 数 。 

“虽然 输出 队列 的 长 度 通常 也 是 有 限 的 ， 但 是 程序 并 不 能 获得 这 个 
定义 其 长 度 的 常量 ， 因 为 当 输 出 队列 将 要 填 满 时 ， 内 核 便 直接 使 写 进 
程 休眠 ， 直 至 写 队 列 中 有 可 用 的 空间 。 

我 们 将 说 明 如 何 使 用 冲洗 函数 tcflush 冲洗 输入 或 输出 队列 。 与 此 
类 似 ， 在 说 明 tcsetattr 函数 时 ， 将 会 了 解 到 如 何 通知 系统 只 有 在 输出 队 
列 为 空 时 ， 才 能 改变 一 个 终端 的 属性 。 (例如 ， 想 要 改变 输出 属性 时 
就 要 这 样 做 。) 也 可 以 通知 系统 ， 让 它 在 改变 终端 属性 时 丢弃 输入 队 
列 中 的 所 有 东西 。 (如 有 果 正 在 改变 输入 属性 ， 或 者 在 规范 模式 和 非 规 
泡 模 式 之 间 进 行 转换 ， 就 需要 这 样 做 ， 以 兔 以 错误 的 模式 对 以 前 输入 
的 字符 进行 解释 。) 

大 多 数 UNIX 系统 在 一 个 称 为 终端 行规 程 (terminal line 
discipline) 的 模块 中 进行 全 部 的 规范 处 理 。 可 以 将 这 个 模块 设想 成 一 
个 盒子 ， 位 于 内 核 通 用 读 、 写 函数 和 实际 设备 驱动 程序 之 间 ( 见 图 18- 
2) 。 


用 户 进程 


终端 行规 程 


实际 设备 
图 18-2 终端 行规 程 
由 于 将 规范 处 理 分 离 为 单独 的 模块 ， 所 有 的 终端 驱动 程序 都 能 够 
一 致 地 支持 规范 处 理 。 在 第 19 章 讨论 伪 终 端 时 还 将 使 用 此 图 。 
所 有 可 以 检测 和 更 改 的 终端 设备 特性 都 包含 在 termios 结构 中 。 该 
结构 定义 在 头 文件 <termios.h> 中 ， 本 章 使 用 这 一 头 文件 。 


cc t c cc[NCCS]; /* control characters */ 


tcflag t c Iflag; /* local flags */ 


tcflag t c cflag; /* control flags */ 
tcflag t c oflag; /* output flags */ 
tcflag t c iflag; /* input flags */ 


struct termios { 
}; 
粗略 地 说 ， 输 入 标志 通过 终端 设备 驱动 程序 控制 字符 的 输入 ( 例 
如 ， 剥 除 输 入 字 节 的 第 8 位 ， 人 允许 输入 奇偶 校 验 ) ， 输 出 标志 则 控制 驱 
动 程 序 输出 〈 例 如， 执行 输出 处 理 、 将 换行 符 转换 为 CRMLF) ， 控 制 标 


志 影 响 RS-232 串 行 线 〈 例 如 ， 忽 略 调制 解 调 器 的 状态 线 、 每 个 字符 的 
一 个 或 两 个 停止 位 ) ， 本 地 标志 影响 驱动 程序 和 用 户 之 间 的 接口 ( 例 


如 ， 回 显 打 开 或 关闭 、 可 视 地 探 除 字符 、 人 允许 终端 产生 的 信号 以 及 对 
后 台 输 出 的 作业 控制 停止 信号 ) 。 

类 型 tcflag t 的 长 度 足 以 保存 每 个 标志 值 ， 它 经 常 被 定义 为 unsigned 
int 或 者 unsigned long。c_cc 数 组 包含 了 所 有 可 以 更 改 的 特殊 字符 。 
NCCS 是 该 数组 中 元 素 的 数量 ， 其 典型 值 在 15~20 (因为 大 多 数 UNIX 
实现 支持 的 特殊 字符 都 比 POSIX.1 所 定义 的 11 个 要 多 ) 。cc_t 类 型 的 长 
度 足 以 保存 每 个 特殊 字符 ， 典 型 的 是 unsigned char ° 

POSIX 标 准 之 前 的 System V 和 版 本 有 一 个 名 为 <termio.h> 的 头 文件 和 
一 个 名 为 termio 的 数据 结构 。 为 了 与 先前 版 本 有 所 区 别 ，POSIX.1 在 这 
些 名 字 后 加 了 一 个 s。 

图 18-3 至 图 18-6 列 出 了 所 有 可 以 更 改 以 影响 终端 设备 特性 的 终端 
标志 。 注 意 ， 虽 然 Single UNIX Specification 定 义 了 供 所 有 平台 启动 所 
用 的 公共 子 集 ， 但 所 有 实现 都 有 上 自己 的 扩充 部 分 。 这 些 扩充 部 分 大 多 
来 日 各 系统 之 则 的 历史 差异 。18.5 节 将 对 这 些 标志 值 进行 详细 的 讨论 。 


š FreeBSD Linux Mac OS X Solaris 
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CBAUDEXT 扩充 的 波 特 率 

CCAR OFLOW | 输出 的 DCD 流 控制 
CCTS OFLOW | 输出 的 CTS 流 控 制 
CDSR OFLOW | 输出 的 DSR 流 控制 
CDTR IFLOW | 输入 的 DTR 流 控制 
CIBAUDEXT | 扩充 输入 波 特 率 
CIGNORE 忽略 控制 标志 

CLOCAL 忽略 调制 解 调 器 状态 行 
CMSPAR 标记 或 空 奇偶 性 
CREAD 启用 接收 装置 
CRTSCTS 启用 硬件 流 控制 

CRTS IFLOW | 输入 的 RTS 流 控制 
CRTSXOFF 启用 输入 硬件 流 控制 
CSIZE 字符 大 小 屏蔽 字 
CSTOPB 发 送 两 个 停止 位 , 否则 发 送 1 位 
HUPCL 最 后 关闭 时 挂 断 
MDMBUF 与 CCAR_OFLOW 相同 
PARENB 启用 奇偶 校 验 

PAREXT 标记 或 空 奇偶 性 
PARODD 奇 校 验 ， 否 则 为 偶 校 验 


图 18-3 c_cflag 终 端 标志 
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BRKINT | 接 到 BREAK 时 产生 SIGINT 
ICRNL 将 输入 的 CR 转换 为 NL 
IGNBRK | 忽略 BREAK 条 件 

IGNCR 忽略 CR 

IGNPAR | 忽略 奇偶 校 验 出 错 的 字符 
IMAXBEL | 在 输入 队列 满 时 振 铃 

INLCR 将 输入 的 NL 转换 为 CR 
INPCK 打开 输入 奇偶 校 验 

ISTRIP | 剥 除 输入 字符 的 第 8 位 
IUCLC 将 输入 的 大 写字 符 转换 成 小 写字 符 
IUTF8 输入 是 UTF-8 

IXANY 使 任何 字符 都 重新 启动 输出 
IXOFF 使 启用 /禁用 输入 流 控制 起 作用 
IXON 使 启用 /禁用 输出 流 控制 起 作用 
PARMRK | 标记 奇偶 检验 错误 


图 18-4 c_iflag 终 端 标志 


ALTWERASE 


ECHO 
ECHOCTL 
ECHOE 
ECHOK 
ECHOKE 
ECHONL 
ECHOPRT 
EXTPROC 
FLUSHO 
ICANON 
IEXTEN 
ISIG 
NOFLSH 
NOKERNINFO 
PENDIN 
TOSTOP 
XCASE 


使 用 替换 WERASE 算法 
启用 回 显 

回 显 控制 字符 为 ^(Char) 
可 视 地 擦 除 字符 
回 显 杀 死 符 

杀 死 的 可 见 擦 除 

回 显 NL 

硬 拷贝 的 可 见 擦 除 方式 

外 部 字符 处 理 

冲洗 输出 

规范 输入 

使 扩充 的 输入 字符 处 理 起 作用 
使 终端 产生 的 信号 起 作用 
在 中 断 或 退出 后 不 冲洗 
无 来 自 STATUS 的 内 核 输出 
重新 键入 未 决 输入 

对 于 后 台 输 出 发 送 SIGTTOU 
规范 的 大 /小 写 表示 


图 18-5 c_lflag 终 端 标志 
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给 出 了 所 有 可 用 的 选项 后 ， 如 何 才能 检测 和 更 改 终端 设备 的 这 些 
特性 呢 ? 图 18-7 总 结 并 列 出 了 Single UNIX Specification 所 定义 的 对 终端 
设备 进行 操作 的 各 个 函数 。 ( 列 出 的 所 有 函数 都 是 POSIX 基本 规范 的 
组 成 部 分 。9.7 $ EHEH T tcgetpgrp、tcgetsid 和 tcsetpgrpER žit » ) 

注意 ， 对 终端 设备 ，Single UNIX Specification 没 有 使 用 经 典 的 
ioctl， 而 是 使 用 了 图 18-7 中 列 出 的 13 个 函数 。 这 样 做 的 理由 是 对 于 终 
端 设 备 的 ioctl 函 数 ， 其 最 后 一 个 参数 的 数据 类 型 随 执行 动作 的 不 同 而 改 
变 。 因 此 ， 不 可 能 对 参数 进行 类 型 检查 。 
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BSDLY | 退 格 延 迟 屏蔽 字 

CRDLY | CR 延迟 屏蔽 字 

FFDLY | 换 页 延迟 屏蔽 字 

NLDLY | NL 延迟 屏蔽 字 

OCRNL | 将 输出 的 CR 映射 为 NL 
OFDEL | HAA DEL, FUA NUL 
OFILL | 延迟 使 用 填充 符 

OLCUC | 将 输出 的 小 写字 符 映 射 为 大 写字 符 
ONLCR | 将 NL 映射 为 CR-NL 

ONLRET | NL 执行 CR 功能 

ONOCR | 在 0 列 不 输出 CR 

ONOEOT | 在 输出 中 丢弃 EOT 字符 (CD) 
oPOST | 执行 输出 处 理 

OXTABS | 将 制 表 符 扩充 为 空格 

TABDLY | 水 平 制 表 符 延迟 屏蔽 字 
VTDLY | 垂直 制 表 符 延 迟 屏蔽 字 


图 18-6 c_oflag 终 端 标志 


tcgetattr 获取 属性 (termios 结构 ) 
tcsetattr 设置 属性 (termios 结构 ) 
cfgetispeed | 获得 输入 速度 
cfgetospeed | 获得 输出 速度 
cfsetispeed | 设置 输入 速度 
cfsetospeed | 设置 输出 速度 


tcdrain 等 待 所 有 输出 都 被 传输 

tcflow 挂 起 传输 或 接收 

tcflush 冲洗 未 决 输入 和 /或 输出 

tcsendbreak | 发 送 BREAK 字符 

tcgetpgrp 获得 前 台 进 程 组 ID 

tcsetpgrp 设置 前 台 进 程 组 ID 

tcgetsid 得 到 控制 TTY 的 会 话 首 进程 的 进程 组 ID 


图 18-7 终端 IO 画 数 汇总 

虽然 在 终端 设备 上 进行 操作 的 只 有 13 个 函数 ， 但 是 图 18-7 中 的 前 两 
个 函数 (tcgetattr 和 tcsetattr) 能 处 理 大 约 70 种 不 同 的 标志 (OLA 18-3 至 
图 18-6) 。 终 端 设备 有 大 量 选 项 可 供 使 用 ， 此 外 ， 对 于 某 个 特定 设备 

〈 假 设 其 为 终端 、 调 制 解 调 器 、 打 印 机 或 任何 其 他 设备 ) ， 决 定 其 需 

要 哪些 选项 对 我 们 来 说 也 是 一 种 挑 成 ， 这 些 都 使 得 对 终端 设备 的 处 理 
APTE ET 

图 18-7 中 列 出 的 13 个 函数 之 间 的 关系 如 图 18-8 所 示 。 

POSIX.1 没 有 指定 将 波 特 率 信息 存储 在 termios 结 构 中 的 什么 地 方 ， 
它 依赖 于 实现 的 细 市 。 某 些 系 统 ， 如 Solaris， 将 此 信息 存储 在 c_cflag 字 


段 中 。Linux 和 BSD 派 生 的 系统 ， 如 FreeBSD 和 Mac OS X， 则 在 此 结构 
中 有 两 个 分 开 的 字段 : 一 个 存储 输入 速度 ， 另 一 个 存储 输出 速度 。 


p> 


cfsetispeed 
cfgetispeed 
cfsetospeed 
cfgetospeed 


struct 


tcdrain 

tcflush 

tcflow 
tcgetsid 


tcsetattr 
tcgetattr 
tcsendbreak 
tcgetpgrp 
tcsetpgrp 


终端 行规 程 / 终端 设备 驱动 程序 


图 18-8 与 终端 有 关 的 各 男 数 之 间 的 关系 


POSIX.1 定义 了 11 个 在 输入 时 要 特殊 处 理 的 字符 。 实 现 定义 了 男 
外 一 些 特 殊 字 符 。 图 18-9 总 结 并 列 出 了 这 些 特殊 字符 。 


ame Ti i " FreeBSD Linux MacOS 
ESS Jw = i 80 320 X1068 


回 车 (不 能 更 改 ) 
于 弃 输出 VDISCARD 
延迟 挂 起 VDSUSP 
(SIGTSTP) 
文件 结束 VEOF 
行 结束 VEOL 
供 替 换 的 行 结束 |VEOL2 
问 前 擦 除 字符 ” |VERASE 
供 蔡 换 的 向 前 擦 |VERASE2 
除 字符 
中 断 信号 
(SIGINT) 


(不 能 更 改 ) 
退出 信号 VQUIT 
(SIGQUIT) 
再 打印 全 部 输入 |VREPRINT 
恢复 输出 


图 18-9 终端 特殊 输入 字符 汇总 
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状态 请 求 
停止 输出 


挂 起 信号 
(SIGTSTP) 
一 个 地 


图 18-9 终端 特殊 输入 字符 汇总 


在 POSIX.1 的 11 个 特殊 字符 中 ， 其 中 有 9 个 字符 的 值 可 以 任意 
改 。 不 能 更 改 的 两 个 特殊 字符 是 换行 符 和 回 车 符 (分 别 是 m 和 \r) ， 也 
可 能 是 STOP 和 START 字 符 (依赖 于 实现 ) 。 为 了 更 改 ， 只 需要 修改 
termios 结构 中 c. cc 数组 的 相应 项 。 该 数组 中 的 元 素 都 用 名 字 作 为 下 标 
进行 引用 ， 每 个 名 字 都 以 字母 V 开 头 〈 见 图 18-9 中 的 第 3 列 ) 。 


(&&) 


= 


POSIX.1 人 允许 禁止 使 用 这 些 字符 。 若 将 c_cc 数 组 中 的 某 项 设置 为 
_POSIX_VDISABLE 的 值 ， 则 禁止 使 用 相应 特殊 字符 。 

在 Single UNIX Specification BJ ^F EB] hk A rp, x $E 
_POSIX_VDISABLE 是 可 选项 ， 现 在 则 是 必 选 项 。 

本 书 讨 论 的 4 种 平台 都 支持 此 特性 。Linux 3.2.0 和 Solaris 10 将 
_POSIX_VDISABLE 定 义 为 0， 而 FreeBSD 8.0 和 Mac OS X 10.6.8 则 将 其 
定义 为 0xff 。 

某 些 早期 的 UNIX 系 统 所 用 的 方法 是 : 若 与 某 一 特性 相应 的 特殊 输 
入 字符 是 0， 则 禁止 使 用 该 特性 。 

实例 

在 详细 说 明 各 特殊 字符 之 前 ， 先 看 一 个 更 改 特殊 字符 的 小 程序 。 
图 18-10 所 示 的 程序 禁用 中 断 字 符 ， 并 将 文件 结束 符 设置 为 Ctrl+B 。 


#include "apue.h" 
#include «termios.h» 


int 
main (void) 


{ 


struct termios term; 
long vdisable; 
if (isatty(STDIN_FILENO) == 0) 


err_quit("standard input is not a terminal device"); 


if ((vdisable = fpathconf(STDIN FILENO, _PC_VDISABLE)) < 0) 
err_quit("fpathconf error or _POSIX_VDISABLE not in effect"); 


if (tcgetattr(STDIN FILENO, &term) < 0) /* fetch tty state */ 
err sys("tcgetattr error"); 


term.c cc[VINTR] = vdisable; /* disable INTR character */ 
term.c cc[VEOF] = 2; /* EOF is Control-B */ 


if (tcsetattr(STDIN FILENO, TCSAFLUSH, &term) « 0) 


err sys("tcsetattr error"); 


exit(0); 


图 18-10 禁用 中 断 字 符 并 更 改 文件 结束 符 

对 此 程序 要 说 明 以 下 几 点 。 

。 仅 当 标准 输入 是 终端 设备 时 才 修 改 终端 特殊 字符 。 调 用 isatty (I 
18.9 节 ) 对 此 进行 检测 。 

。 用 fpathconf 获 取 _POSIX_VDISABLE 值 。 

“HAL tcgetattr ( 见 18.4 5). 从 内 核 获取 termios 结构 。 在 修改 了 此 
结构 后 ， 调 用 tcsetattr 函数 设置 属性 ， 只 有 我 们 所 希望 修改 的 属性 被 更 
改 了 ， 而 其 他 属性 保持 不 变 。 

"禁用 中 断 键 与 忽略 中 断 信和 号 是 不 同 的 。 图 18-10 中 的 程序 所 做 的 
只 是 禁用 使 终端 驱动 程序 产生 SIGINT 信 和 号 的 特殊 字符 。 我 们 仍 可 使 用 
ki 函数 将 该 信号 发 送 至 进程 。 

下 面 较 详 细 地 说 明 各 个 特殊 字符 。 我 们 称 这 些 字符 为 特殊 输入 字 
符 ， 但 是 其 中 有 两 个 字符 一 STOP 和 START 《Ctrl+S 和 Ctrl+Q) ， 在 输 
出 时 也 要 进行 特殊 处 理 。 注 意 ， 这 些 字符 中 的 大 多 数 在 被 终端 驱动 程 
序 识别 并 进行 特殊 处 理 后 会 被 丢弃 ， 并 不 将 它们 返回 给 执行 读 终端 操 
作 的 进程 。 返 回 给 读 进 程 的 例外 字符 是 换行 符 (NL ` EOL ` EOL2) 和 
回 车 符 (CR) 

CR 回 车 符 。 不 能 更 改 此 字符 。 以 规范 模式 进行 输入 时 识别 此 字 
符 。 在 已 设置 ICANON (规范 模式 ) 和 ICRNL (将 CR 映射 为 NL) 但 并 
未 设置 IGNCR (忽略 CR) 时 ，CR 字 符 会 被 转换 成 NL， 并 具有 与 NL 
字符 相同 的 作用 。 此 字符 返回 给 读 进 程 (很 可 能 是 在 转换 为 NL 之 
后 ) 

DISCARD 丢弃 符 。 在 扩充 模式 (EXTEN) 下 进行 输入 时 识别 此 
字符 。 在 输入 另 一 个 DISCARD 字 符 之 前 或 在 丢弃 条 件 被 清除 之 前 〈 见 
FLUSHO 选项 ) ， 此 字符 使 后 续 输 出 都 被 丢弃 。 此 字符 在 处 理 后 即 被 
丢弃 ( 即 不 传送 给 读 进 程 ) 


DSUSP 延迟 挂 起 作业 控制 字符 (delayed-suspend job-control 
character) 。 在 扩充 模式 (IEXTEN) 下 ， 若 支持 作业 控制 ， 并 且 已 设 
置 ISIG 标 志 ， 则 在 输入 时 识别 此 字符 。 与 SUSP 字 符 的 相同 之 处 是 : 延 
述 挂 起 字符 产生 SIGTSTP 信 和 号， 该 信号 被 发 送 至 前 台 进 程 组 中 的 所 有 
进程 ( 见 图 9-7) 。 但 是 ， 信 号 产生 的 时 间 并 不 是 在 键入 延迟 挂 起 字符 
之 时 ， 而 是 在 某 个 进程 从 控制 终端 读 到 此 字符 时 才 产 生 。 此 字符 在 处 
理 后 即 被 丢弃 〈 即 不 传送 给 读 进 程 ) 

EOF 文件 结束 符 。 以 规范 模式 (ICANON) 进行 输入 时 识别 此 字 
人 特 。 当 键入 此 字符 时 ， 等 待 被 读 的 所 有 字 都 被 立即 传送 给 读 进 程 。 
如 果 没 有 字 节 等 待 恋 ， 则 返回 90。 在 行 首 输入 一 个 EOF 字符 是 向 程序 

和 示 文 件 结束 的 正常 方式 。 此 字符 在 规范 模式 下 处 理 后 即 被 丢弃 (HU 
不 传送 给 读 进 程 ) 

EOL PR UA TEAR, FS NL 作用 相同 。 以 规范 模式 

(ICANON) 进行 输入 时 识别 此 字符 ， 并 将 此 字符 返回 给 读 进 程 。 但 
是 此 字符 不 常用 。 

EOL2 男 一 个 行 定 界 符 ， 与 NL 作用 相同 。 对 此 字符 的 处 理 方式 与 
EOL F FHH] ° 

ERASE 癌 前 擦 除 字符 ORTE) 。 以 规范 模式 (ICANON) 输入 时 
识别 此 字符 。 它 擦 除 行 中 的 前 一 个 字符 ， 但 不 会 超越 行 首 字符 擦 除 上 
一 行 中 的 字符 。 此 字符 在 规范 模式 下 处 理 后 即 被 丢弃 〈 即 不 传送 给 读 
进程 ) 。 

ERASE2 供 替 换 的 向 前 控 除 字符 ORIK) 。 对 此 字符 的 处 理 与 向 
前 擦 除 字符 (ERASE) 完全 相同 。 

INTR 中 断 字 符 。 寿 已 设置 ISIG 标 志 ， 则 在 输入 中 识别 此 字符 。 它 
产生 SIGINT 信 和 号， 该 信号 被 送 至 前 台 进 程 组 中 的 所 有 进程 ( 见 图 9- 
7) 。 此 字符 在 处 理 后 即 被 丢弃 〈 即 不 传送 给 读 进 程 ) 


KILL 杀 死 字符 。 (名 字 “ 杀 死 * 在 这 里 义 一 次 被 误 用 ，k 记 l 画 数 是 用 
来 将 某 一 信号 发 送 给 进程 的 ， 而 此 字符 应 被 称 为 行 擦 除 符 ， 它 与 信号 
毫 无 关系 。) 以 规范 模式 (ICANON) 输入 时 识别 此 字符 。 它 擦 除 一 
整 行 ， 并 在 处 理 后 即 被 丢弃 ( 即 不 传送 给 读 进程 ) 

LNEXT 下 一 个 字符 的 字面 值 (iteral-next character) 。 以 扩充 方式 

(IEXTEN) 输入 时 识别 此 字符 ， 它 使 下 一 个 字符 的 任何 特殊 含意 都 被 
忽略 。 这 对 本 市 提 及 的 所 有 特殊 字符 都 起 作用 。 使 用 这 一 字符 可 向 程 
序 键入 任何 字符 。LNEXT 字 符 在 处 理 后 即 被 丢弃 ， 但 输入 的 下 一 个 字 
符 被 传送 给 读 进 程 。 

NL 换行 字符 ， 也 被 称 为 行 定 界 符 。 不 能 更 改 此 字符 。 以 规范 模式 

(ICANON) 输入 时 识别 此 字符 。 此 字符 返回 给 读 进 程 。 

QUIT 退出 字符 。 若 已 设置 ISIG 标 志 ， 则 在 输入 中 识别 此 字符 。 它 
产生 SIGQUIT 信 号 ， 该 信号 又 被 送 至 前 台 进 程 组 中 的 所 有 进程 ( 见 图 9- 
7) 。 此 字符 在 处 理 后 即 被 丢弃 〈 即 不 传送 给 读 进 程 ) 

回忆 图 10-1，INTR 和 QUIT 的 区 别 是 : QUIT 字 符 不 仅 按 默认 规则 
终止 进程 ， 而 且 还 产生 一 个 core 文 件 。 

REPRINT 再 打印 字符 。 以 扩充 规范 模式 (设置 了 IEXTEN 和 
ICANON 标 志 ) 进行 输入 时 识别 此 字符 。 它 使 所 有 未 读 的 输入 被 输出 

(SET) 。 此 字符 在 处 理 后 即 被 丢弃 ( 即 不 传送 给 读 进 程 ) 

START 启动 字符 。 若 已 设置 IXON 标 志 ， 则 在 输入 中 识别 此 字符 。 
若 已 设置 IXOFF 标 志 ， 则 自动 产生 此 字符 作为 输出 。 已 设置 [XON 时 ， 
接收 到 的 START 字符 使 停止 的 输出 (由 以 前 输入 的 STOP 字 符 造 成 ) Æ 
新 启动 。 在 此 情形 下 ， 此 字符 在 处 理 后 即 被 丢弃 ( 即 不 传送 给 读 进 
程 ) 

STATUS BSD 的 状态 请 求 字 符 。 以 扩充 规范 模式 (设置 了 
IEXTEN 和 ICANON 标志 ) 进行 输入 时 识别 此 字符 。 它 产生 SIGINFO 
信号 ， 该 信号 又 被 送 至 前 台 进 程 组 中 的 所 有 进程 〈 见 图 9-7) 。 另 外 ， 


如 果 没 有 设置 NOKERNINFO 标 志 ， 则 有 关 前 台 进 程 组 的 状态 信息 也 显 
示 在 终端 上 。 此 字符 在 处 理 后 即 被 丢弃 〈 即 不 传送 给 读 进程 ) 

STOP 停止 字符 。 若 已 设置 IXON 标 志 ， 则 在 输入 中 识别 此 字符 。 
若 已 设置 IXOFF 标 志 ， 则 自动 产生 此 字符 作为 输出 。 已 设置 [XON 时 ， 
接收 到 STOP 字 符 则 停止 输出 。 在 此 情形 下 ， 此 字符 在 处 理 后 即 被 丢弃 

( 即 不 传送 给 读 进 程 ，。 当 输入 一 个 START 字 符 后 ， 被 停止 的 输出 重 
新 启动 。 

SUSP 挂 起 作业 控制 字符 。 若 支持 作业 控制 并 且 已 设置 ISIG 标 志 ， 
则 在 输入 中 识别 此 字符 。 它 产生 SIGTSTP 信 号， 该 信号 又 被 送 至 前 台 
进程 组 的 所 有 进程 〈 见 图 9-7) 。 此 字符 在 处 理 后 即 被 丢弃 〈 即 不 传送 
给 读 进程 ) 

已 设置 IXOFF 标志 时 ， 若 新 的 输入 不 会 使 输入 缓冲 区 洲 出 ， 则 终 
端 驱 动 程序 自动 产生 一 个 START 字 符 来 恢复 以 前 被 停止 的 输入 。 

已 设置 IXOFF 时 ， 终 端 驱 动 程序 自动 产生 一 个 STOP 字 符 以 防止 输 
入 缓冲 区 洪 出 。 

WERASE 字 擦 除 字 符 。 以 扩充 规范 模式 (设置 了 IEXTEN 和 
ICANON 标 志 ) 进行 输入 时 识别 此 字符 。 它 使 前 一 个 字 被 擦 除 。 首 
先 ， 它 向 前 跳 过 任意 一 个 空白 字符 (空格 或 制 表 符 ) ， 然 后 再 向 前 跃 
过 前 一 记号 ， 使 光标 处 在 前 一 个 记号 的 第 一 个 字符 位 置 上 。 通 常 ， 前 
一 个 记号 在 碰 到 一 个 空白 字符 时 即 终 止 。 但 是 ， 可 通过 设置 
ALTWERASE 标 志 来 改变 这 个 行为 。 此 标志 使 前 一 个 记号 在 页 到 第 一 
个 非 字 母 、 非 数字 字符 时 即 终止 。 此 字符 在 处 理 后 即 被 丢弃 〈 即 不 传 
送 给 读 进 程 ) 

需要 为 终端 设备 定义 的 另 一 个 “字符 ”是 BREAK FIF ° BREAK SZ 
际 上 并 不 是 一 个 字符 ， 而 是 在 异步 串 行 数据 传送 时 发 生 的 一 个 条 件 。 
根据 串 行 接口 的 不 同 ， 可 以 有 多 种 方式 通知 设备 驱动 程序 发 生 了 
BREAK 条 件 。 


大 多 数 早 期 的 串 行 终端 都 有 一 个 标记 为 BREAK 的 键 ， 用 其 可 以 产 
生 BREAK 条 件 ， 这 就 是 为 什么 大 多 数 人 认为 BREAK 束 是 一 个 字符 的 原 
。 某 些 较 新 的 终端 键盘 没有 BREAK 键 。 在 PC 上 ，BREAK 键 可 能 
其 他 用 途 。 例 如 ， 键 入 Ctrl+BREAK 可 中 断 Windows 命 令 解释 器 。 

对 于 异步 串 行 数据 传送 ，BREAK 是 一 个 0 值 的 位 序列 ， 其 持续 时 
间 长 于 要 求 发 送 一 个 字 节 的 时 间 。 整 个 0 值 位 序列 被 视 为 是 一 个 
BREAK 。18.8 节 将 说 明 如 何 用 tcsendbreak 函 数 发 送 一 个 BREAK。 


18.4 IRSA EI ZAR IER 


为 了 获得 和 设置 termios 结 构 ， 可 以 调用 tcgetattr 和 tcsetattr 芳 数 。 这 
样 束 可 以 检测 和 修改 各 种 终端 选项 标志 和 特殊 字符 ， 使 终 闹 按 我 们 所 
布 望 的 方式 进行 操作 。 

#include <termios.h> 

int tcgetattr(int fd, struct termios *termptr); 

int tcsetattr(int fd, int opt, const struct termios *termptr); 

两 个 函数 的 返回 值 : AH, GRIGIO; 在 出 错 ， 返 回 -1 

这 两 个 函数 都 有 一 个 指向 termios 结 构 的 指针 作为 其 参数 ， 它 们 或 
者 返回 当前 终 端 的 属性 ， 或 者 设置 该 终 问 的 属性 。 因 为 这 两 个 钞 数 只 
对 终端 设备 进行 操作 ， 所 以 奉 fd 没 有 引用 终端 设备 则 出 错 返 回 -1，errno 
设置 为 ENOTTY ° 

tcsetattr 的 参数 opt 使 我 们 可 以 指定 在 什么 时 候 新 的 终端 属性 才 起 作 
用 。opt 可 以 指定 为 下 列 常量 中 的 一 个 。 

TCSANOW 更 改 立 即 发 生 。 

TCSADRAIN 发 送 了 所 有 输出 后 更 改 才 发 生 。 大 更 改 输 出 参数 则 
应 使 用 此 选项 。 


TCSAFLUSH 发 送 了 所 有 输出 后 更 改 才 发 生 。 更 进一步 ， 在 更 改 
发 生 时 未 读 的 所 有 输入 数据 都 被 丢弃 (冲洗 ) 。 

Tcsetattr 函数 的 返回 状态 在 使 用 时 易 产 生 混 消 。 如 果 它 执行 了 任意 
一 种 所 要 求 的 动作 ， 即 使 未 能 执行 所 有 要 求 的 动作 ， 它 也 返回 OK (GE 
示 成 功 ) 。 如 果 该 函数 返回 OK， 则 我 们 有 责任 检查 该 本 数 是 否 执行 了 
所 有 要 求 的 动作 。 这 就 意味 着 ， 在 调用 tcsetattr 设 置 所 锅 望 的 属性 后 ， 
需 调 用 tcgetattr， 然 后 将 实际 终端 属性 与 所 希望 的 属性 相 比 较 ， 以 检测 
MEERA KHI) 

在 终端 第 一 次 被 打开 时 ， 其 属性 视 具 体 情 况 而 定 。 一 些 系统 可 能 
会 将 终端 属性 初始 化 为 具体 实现 所 定义 的 值 ， 男 一 些 系统 可 能 会 保留 
并 使 用 最 后 一 次 使 用 终端 时 的 属性 值 。 通 过 打开 一 个 市 有 O_TTY_INIT 
标志 (0.3.3155) 的 驱动 设备 ， 可 以 确认 终端 的 行为 是 否 遵循 标准 ， 这 
样 隐 能 在 调用 tcgetattr 时 ， 确 傈 初始 化 termios 结 构 中 的 任何 非 标准 部 
分 ， 使 得 在 修改 属性 和 调用 tcgetattr 时 ， 终 端的 表现 符合 预期 。 


18.5 终端 选项 标志 


本 节 将 列 出 所 有 不 同 的 终端 选项 标志 ， 扩 展 图 18-3 至 图 18-6 中 的 说 
明 。 我 们 将 按 字 母 顺 序列 出 各 个 选项 并 指出 每 个 选项 出 现在 4 个 终端 
标志 字段 中 的 哪 一 个 。 《从 选项 名 字 中 看 不 出 它 所 处 的 字段 。) 还 将 
说 明 每 个 选项 是 否 是 Single UNIX Specification 定 义 的 ， 并 列 出 了 支持 该 
选项 的 平台 。 

列 出 的 所 有 选项 标志 ( 除 所 谓 的 屏蔽 字 标 志 外 ) 都 用 一 位 或 多 位 
(设置 或 清除 ) 表示 。 屏 蔽 字 标 志 定 义 多 个 位 ， 它 们 组 合 在 一 起 ， 可 
以 定义 一 组 值 。 屏 菩 字 标志 有 一 个 定义 名 ， 每 个 值 也 有 一 个 名 字 。 例 


如 ， 为 了 设置 字符 长 度 ， 首 先 用 字符 长 度 屏蔽 字 标 志 CSIZE 将 表示 字 
符 长 度 的 位 清 0， 然 后 设置 下 列 值 之 一 : CS5、CS6、CS7 或 CS8 。 

由 Linux 和 Solaris 文 持 的 6 个 延迟 值 也 有 屏蔽 字 标 志 : BSDLY ^ 
CRDLY、FFDLY、NLDLY、TABDLY 和 VTDLY。 对 于 每 个 延迟 值 的 长 
度 请 参阅 Solaris 中 的 termio(7D) 手 册页 。 在 所 有 情况 下 ， 延 迟 屏蔽 字 为 0 
瓯 表示 没有 延迟 。 如 果 指 定 了 延迟 ， 则 由 OFILL 和 OFDEL 标 志 决 定 是 
由 驱动 妖 进 行 实际 延迟 还 是 只 传输 填充 字符 。 

实例 

图 18-11 演 示 了 如 何 使 用 这 些 屏 蔽 字 标 志 取 一 个 值 或 者 设置 一 个 
值 。 


#include "apue.h" 


#include «termios.h» 


int 
main (void) 
( 


struct termios term; 


if (tcgetattr(STDIN FILENO, &term) « 0) 
err sys("tcgetattr error"); 


switch (term.c cflag & CSIZE) { 
case CS5: 
printf ("5 bits/byte\n"); 
break; 
case CS6: 
printf("6 bits/byte\n"); 
break; 
case CS7: 
printf("7 bits/byte\n") ; 
break; 
case CS8: 
print ("8 bits/byte\n"); 
break; 
default: 
printf ("unknown bits/byte\n") ; 
) 


term.c cflag &= ~CSIZE; /* zero out the bits */ 
term.c cflag |= CS8; /* set 8 bits/byte */ 
if (tcsetattr(STDIN FILENO, TCSANOW, &term) < 0) 


err sys("tcsetattr error"); 


exit(0); 


图 18-11 tcgetattr 和 tcsetattr 实 例 

下 面 说 明 各 选项 标志 。 

ALTWERASE (c flag, FreeBSD ^ Mac OS X) 已 设置 此 标志 
IY, a 4i AWERASE 7%, JU (5 Hj SRE RR IE 9» "VETERI 
前 移动 到 前 一 个 空白 字符 为 止 ， 而 是 向 前 移动 到 第 一 个 非 字 母 、 非 数 
字 字 符 为 止 。 

BRKINT (c iflag, POSIX.1 ^ FreeBSD ` Linux ^ Mac OS X ` 
Solaris) 若 已 设置 此 标志 ， 而 未 设置 IGNBRK， 则 在 接 到 BREAK HJ, 
冲洗 输入 、 输 出 队列 ， 并 产生 一 个 SIGINT 信号 。 如 果 此 终端 设备 是 一 
个 控制 终端 ， 则 此 信和 号 就 是 为 前 台 进 程 组 产生 的 。 

知 未 设置 TIGNBRK 和 BRKINT， 但 是 设置 了 PARMRK ， 则 BREAK 
被 读 作 一 个 3 字 节 序列 377、\0 和 \0; 若 也 未 设置 PARMRK， 则 BREAK 
被 读 作 单个 字符 \0。 

BSDLY (c oflag, XSI ^ Linux ^ Solaris) 退 格 延迟 屏蔽 字 。 此 屏 
蔽 字 的 值 是 BS0 或 BS1。 (c cflag, Solaris) 扩充 的 波 特 率 。 用 于 人 允许 
大 于 B38400 的 波 特 率 。 (将 在 18.7 节 讨论 波 特 率 。) CBAUDEXT 

CCAR OFLOW (c_cflag, FreeBSD ` Mac OS X) 使 用 RS-232 调 
制 解 调 器 DCD (Data-Carrier-Detect， 数 据 载波 检测 ) 信号 打开 输出 的 
硬件 流 控制 。 这 与 早期 的 MDMBUF 标 志 相同 。 

CCTS OFLOW (c cflag, FreeBSD ` Mac OS X ` Solaris) 使 用 
RS-232 CTS (Clear-To-Send， 清 除 发 送 ) 信号 打开 输出 的 硬件 流 控 
制 。 


CDSR OFLOW (c cflagg, FreeBSD ^ Mac OS X) 根据 RS-232 
DSR (Data-SetrReady， 数 据 准备 就 绪 ) 信号 进行 输出 的 流 控 制 。 

CDTR IFLOW (c cflag, FreeBSD, Mac OS X) 根据 RS-232 DTR 

(Data-Terminal-Ready， 数 据 终端 就 绪 ) 信号 进行 输入 的 流 控 制 。 

CIBAUDEXT (c_cflag, Solaris) 扩充 的 输入 波 特 率 。 用 于 允许 大 
于 B38400 的 输入 波 特 率 。 

(将 在 18.7 市 讨论 波 特 率 。) 

CIGNORE (c cflag, FreeBSD ^ Mac OS X) 忽略 控制 标志 。 

CLOCAL (c cflag, POSIX.1 ^ FreeBSD ` Linux ^ Mac OS X ` 
Solaris) 若 设 置 ， 则 忽略 调制 解 调 器 状态 线 。 这 通常 意味 着 该 设备 是 直 
接连 接 的 。 例 如 ， 若 未 设置 此 标志 ， 则 打开 一 个 终端 设备 常常 会 遭遇 
阻塞 ， 直 到 调制 解 调 器 回应 呼叫 并 建立 连接 。 

CMSPAR (c oflag, Linux) 选择 标记 或 空 奇 偶 校 验 。 若 已 设置 
PARODD， 则 奇偶 校 验 位 总 是 1 〈 标 记 奇 偶 校 验 ) 。 否 则 奇 侦 校 验 位 总 
是 0 ( 空 奇偶 校 验 ) 。 

CRDLY (c oflag, XSI ` Linux ^ Solaris) 回 车 延迟 屏蔽 字 。 此 屏 
蔽 字 的 可 能 值 是 CRO0、CR1、CR2 和 CR3。 

CREAD (c cflag, POSIX.1 ^ FreeBSD ` Linux ^ Mac OS X ` 
Solaris) 知 设 置 ， 则 接收 者 被 启用 ， 可 以 接收 字符 。 

CRTSCTS (c cflag, FreeBSD ` Linux ^ Mac OS X ` Solaris) 其 行 
为 依赖 于 平台 。 对 于 Solaris， 若 设置 该 标志 ， 则 允许 带 外 硬件 流 控 制 。 
在 另外 3 个 平台 上 ， 则 既 允 许 带 内 硬件 流 控制 ， 又 允许 带 外 硬件 流 控 
Hl (等 价 于 CCTS OFLOW|CRTS IFLOW) 。 

CRTS IFLOW (c cflag, FreeBSD ^ Mac OS X ` Solaris) 输入 的 
RTS (Request-To-Send, KRIE) 流 控制 。 

CRTSXOFF (c cflag, Solaris) 若 设 置 ， 则 允许 带 内 硬件 流 控 
制 ，RS-232 RTS 信 和 号 的 状态 控制 了 流 控 制 。 


CSIZE ( c. cflag , POSIX.1 ^ FreeBSD ^ Linux ^ MacOS X ` 
Solaris) 此 字段 是 一 个 屏蔽 字 标 志 ， 它 指定 发 送 和 接收 的 每 个 字 节 的 位 
数 。 此 长 度 不 包括 可 能 有 的 奇偶 校 验 位 。 由 此 屏蔽 字 定 义 的 字段 值 是 
CS5 ` CS6 ` CS7 和 CS8， 分 别 表示 每 个 字 市 包含 5 位 、6 位 、7 位 和 8 
位 。 

CSTOPB (c_cflag , POSIX.1 ^ FreeBSD ^ Linux ^ Mac OS X ` 
Solaris) 车 设置 ， 则 使 用 两 个 停止 位 ， 否 则 只 使 用 一 个 停止 位 。 

ECHO (clflag, POSIX.1 ^ FreeBSD ` Linux ` Mac OS X ^ 
Solaris) Zi EL, MRA FEE TEA o AYE ASEM IE 
模式 下 都 可 以 回 显 输入 字符 。 

ECHOCTL (c lflag, FreeBSD ` Linux ` Mac OS X ` Solaris) #ix 
置 并 且 也 设置 ECHO WJÉRASCII TAB ` ASCII NL 以 及 START 和 STOP 
字符 外 ， 其 他 ASCI 控 制 字符 (ASCII 字 符 集 中 0 至 八进制 37 对 应 的 字 
符 ) 都 被 回 显 为 AXX， 其 中 ，X 是 相应 控制 字符 加 上 八进制 100 所 构成 的 
字符 。 例 如 ，ASCII Crha FiF (八进制 1) 被 回 显 为 AA。ASCII 
DELETE 字 符 (八进制 177) METH? °: ERRAILEN, ASCH 
制 字符 按 其 原样 回 显 。 如 同 ECHO 标 志 ， 在 规范 模式 和 非 规 苑 模式 下 ， 
此 标志 对 控制 字符 回 显 都 起 作用 。 

应 当 了 解 的 是 ， 某 些 系 统 以 不 同方 式 回 旺 EOF 字 和 人 符 ， 因 为 EOF 的 典 
型 值 是 Ctl+D (Ctrl+D ASCII EOT 字 符 ， 它 可 能 使 某 些 终端 挂 
Wt) 。 请 查看 有 关 手 册 。 

ECHOE (c flag, POSIX.1 ` FreeBSD ` Linux ^ Mac OS X > 
Solaris) 若 设置 并 且 也 设置 ICANON， 则 ERASE 字 符 从 显示 中 控 除 当前 
行 中 的 最 后 一 个 字符 。 这 通常 是 在 终端 驱动 程序 中 写 一 个 3 字符 序列 实 
现 的 ， 该 序列 是 : IRA EK RI o ASTER WERASE FIF, Ill 
ECHOE Hi — t : Tr ERFA FF RR BI ON Fe AF 


ECHOPRT 标志 ， 则 这 里 说 明 的 天 于 ECHOE 的 动作 是 在 假定 未 设置 
ECHOPRT 标 志 的 条 件 下 得 出 的 。 

ECHOK (c_lflag, POSIX.1 ^ FreeBSD ` Linux ^ Mac OS X ` 
Solaris) 若 设 置 并 且 也 设置 ICANON， 则 KILL 字 符 从 显示 中 擦 除 当 前 
fr, 或 者 输出 NL 字符 (用 以 强调 已 擦 除 整个 行 ) 。 

若 支 持 ECHOKE 标 志 ， 则 关于 ECHOK 的 说 明 是 在 假定 未 设置 
ECHOKE 标 志 的 条 件 下 得 出 的 。 

ECHOKE (c_lflag, FreeBSD ^» Linux ` Mac OS X ` Solaris) 若 设 
置 并 且 也 设置 ICANON， 则 回 显 KILL 字符 的 方式 是 擦 除 行 中 的 每 一 个 
字符 。 擦 除 每 个 字符 的 方法 则 由 ECHOE 和 ECHOPRT 标 志 选 择 。 

ECHONL (c flag, POSIX.1 ` FreeBSD ^ Linux ^ Mac OS X ` 
Solaris) 若 设置 并 且 也 设置 TICANON， 即 使 没有 设置 ECHO， 也 回 显 NL 
字符 。 

ECHOPRT (c flag, FreeBSD ` Linux ` Mac OS X ` Solaris) “ix 
置 并 且 也 设置 ICANON 和 ECHO ， 则 ERASE 字 符 (以 及 WERASE 字 
符 ， 若 受到 支持 ) 使 所 有 正 被 擦 除 的 字符 按 它们 被 擦 除 的 方式 被 打 
印 。 这 一 方法 常 在 硬 拷贝 终端 上 显示 其 作用 ， 它 可 以 使 我 们 确切 地 看 
到 哪些 字符 正 被 删除 。 

EXTPROC (c lflag, FreeBSD ` Linux ^ Mac OS X) 若 设置 ， 规 
T5 FF Mb BH ERE S SEZ PHA oo WIR HB Sb iB Be et TT 

EB 


GITARER ENLA, JD Nun] AAEE ^ EE H 
伪 终 端 时 〈 见 第 19 章 ) ， 也 可 以 这 样 设置 。 

FFDLY (c oflag, XSI ` Linux ^ Solaris) 4 THEIR BRIG » UU BÉ 
WC EIS Ee FFOBKFF1 ° 

FLUSHO (c_lflag, FreeBSD ` Linux ^ Mac OS X » Solaris) 若 设 
置 ， 则 冲洗 输出 。 当 键入 DISCARD 字符 时 设置 此 标志 。 当 键入 另 一 


个 DISCARD 字符 时 ， 此 标志 被 清除 。 可 以 通过 设置 或 清除 此 终端 标 
志 来 设置 或 清除 此 条 件 。 

HUPCL (c cflag, POSIX.1 ^ FreeBSD ^ Linux ^ Mac OS X ` 
Solaris) 若 设 置 ， 则 当 最 后 一 个 进程 关闭 设备 时 ， 调 制 解 调 器 控制 线 降 
FREF 〈 也 就 是 调制 解 调 器 的 连接 断 开 ) 。 

ICANON (c flag, POSIX.1 ^ FreeBSD ` Linux ^ Mac OS X ` 
Solaris) 若 设 置 ， 则 按 规范 模式 工作 〈 见 18.10 节 ) 。 这 使 下 列 字符 起 
作用 : EOF、EOL、EOL2、ERASE、KILL、REPRINT、STATUS 和 
WERASE。 输 入 字符 被 装配 成 行 。 

ICRNL (ciflag, POSIX.1 ^ FreeBSD ` Linux ^ Mac OS X » 
Solaris) 若 设置 并 且 未 设置 TIGNCR， 则 将 接收 到 的 CR 字符 转换 成 NL 字 
FF ° 

IEXTEN (c_lflag, POSIX.1 ^ FreeBSD ` Linux ^ Mac OS X ` 
Solaris) 若 设 置 ， 则 识别 并 处 理 扩展 的 、 由 实现 定义 的 特殊 字符 。 

IGNBRK (c iflag, POSIX.1 ` FreeBSD ` Linux ` Mac OS X ` 
Solaris) 在 已 设置 时 ， 名 略 输入 中 的 BREAK 条 件 。 关 于 BREAK 条 件 是 
产生 SIGINT 信 号 还 是 被 作为 数据 读 取 ， 见 BRKINT ° 

IGNCR (c iflag, POSIX.1 ^ FreeBSD ` Linux ^ Mac OS X ` 
Solaris) 若 设 置 ， 则 忽略 接收 到 的 CR 字符 。 若 末 设 置 此 标志 ， 而 设置 
了 ICRNL 标 志 ， 则 有 可 能 将 接收 到 的 CR 字符 转换 成 NL 字 人 符 。 

IGNPAR (c iflag, POSIX.1 ` FreeBSD ` Linux ^ Mac OS X ` 
Solaris) 在 已 设置 时 ， 名 上 略 这 有 结构 出 错 GIEBREAK) 或 奇偶 出 错 的 
AFT ° 

IMAXBEL (c iflag, FreeBSD ` Linux ^ Mac OS X ` Solaris) “4 ij 
入 队列 满 时 响 铃 。 

INLCR (ciflag, POSIX.1 ^ FreeBSD ` Linux ^ Mac OS X » 
Solaris) 若 设 置 ， 则 将 接收 到 的 NL 字符 转换 成 CR 字符 。 


如 果 不 以 规范 模式 工作 ， 则 读 请 求 直 接 从 输入 队列 取 字 符 。 在 至 
少 接 到 MIN 个 字 节 或 两 个 字 节 之 间 的 超时 值 TIME 到 期 时 ，read 才 返 
回 。 详 细 情 况 参 见 18.11 闻 。 

INPCK (c iflag, POSIX.1 ` FreeBSD ` Linux ^ Mac OS X ` 
Solaris) 在 已 设置 时 ， 使 输入 奇偶 校 验 起 作用 。 若 未 设置 INPCK， 则 使 
输入 奇偶 校 验 不 起 作用 o 

奇偶 “产生 和 检测 "和 “输入 奇 俩 校 验 ”是 两 件 不 同 的 事 。 奇 个 位 的 产 
生 和 检测 是 由 PARENB 标 志 控 制 的 。 设 置 该 标志 后 通常 会 使 串 行 接口 的 
设备 驱动 程序 对 输出 字符 产生 奇 个 位 ， 对 输入 字符 则 验证 其 奇偶 性 。 
PARODD 标志 决定 该 奇偶 性 应 当 是 奇 还 是 个 。 如 采 一 个 其 奇偶 性 错误 
的 输入 字符 到 来 ， 则 检查 INPCK 标 志 的 状态 。 大 已 设置 此 标志 ， 则 检 
查 IGNPAR 标 志 (以 决定 是 否 应 忽略 带 奇 偶 出 错 的 输入 字 节 ) ; 若 不 应 
忽略 此 输入 字 节 ， 则 检查 PARMRK 标 志 以 决定 应 该 向 读 进程 传送 哪些 
字符 。 

ISIG (c lflag, POSIX.1 ` FreeBSD ` Linux ` Mac OS X ` Solaris) 
若 设 置 ， 则 判别 输入 字符 是 否 是 要 产生 终端 信号 的 特殊 字符 ONTR^ 
QUIT、SUSP 和 DSUSP) ; 若是 ， 则 产生 相应 信号 。 

ISTRIP (c_iflag, POSIX.1 ^ FreeBSD ` Linux ^ Mac OS X ` 
Solaris) 在 已 设置 此 标志 时 ， 有 效 输入 字 市 被 剥离 为 7 位 。 在 未 设置 
时 ， 则 处 理 全 部 8 位 。 

IUCLC (c iflag，Linux、Solaris) 将 输入 的 大 写字 符 转换 成 小 写 
字符 。 

IUTF8 (c iflag, Linux ^ Mac OS X) 允许 使 用 UTF-8 多 字 节 字符 
进行 字符 擦 除 处 理 。 

IXANY (c_iflag, XSI ^ FreeBSD ` Linux ` Mac OS X ` Solaris) 
使 任何 字符 都 能 重新 启动 输出 。 


IXOFF (c_iflag, POSIX.1 ^ FreeBSD ` Linux ^ Mac OS X ` 
Solaris) 若 设置 ， 则 使 启动 -停止 输入 控制 起 作用 。 当 终端 驱动 程序 发 
现 输入 队列 将 要 填 满 时 ， 输 出 一 个 STOP 字 符 。 此 字符 应 当 由 发 送 数据 
的 设备 识别 ， 并 使 该 设备 停止 。 此 后 ， 当 把 输入 队列 中 的 字符 处 理 完 
毕 之 后 ， 终 端 驱动 程序 将 输出 一 个 START 字 符 ， 使 该 设备 恢复 发 送 数 
据 。 

IXON (ciflag, POSIX.1 ^ FreeBSD ` Linux ^ Mac OS X ` 
Solaris) 若 设 置 ， 则 使 启动 -停止 输出 控制 起 作用 。 当 终端 驱动 程序 接 
收 到 一 个 STOP 字 符 时 ， 输 出 停止 。 在 输出 停止 时 ， 下 一 个 START 字 符 
恢复 输出 。 若 未 设置 此 标志 ， 则 START 和 STOP 字 符 由 进程 作为 一 般 字 
符 读 取 。 

MDMBUF (c cflag, FreeBSD ^ Mac OS X) 按照 调制 解 调 器 的 载 
波 标志 进行 输出 流 控 制 。 这 是 CCAR_OFLOW 标 志 的 曾 用 名 。 

NLDLY (c_oflag，XSI、Linux、Solaris) 换行 延迟 屏蔽 字 。 此 屏 
菩 字 的 值 是 NL0 或 NL1 © 

NOFLSH (c flag, POSIX.1 ^ FreeBSD ` Linux ^ Mac OS X ` 
Solaris) 按 系统 默认 ， 当 终端 驱动 程序 产生 SIGINT 和 SIGQUIT 信和 号 
上 时， 输入 和 输出 队列 都 被 冲洗 。 男 外 ， 当 它 产 生 SIGSUSP 信 号 时 ， 输 
入 队列 被 冲洗 。 若 已 设置 NOFLSH 标 志 ， 则 在 这 些 信号 产生 时 ， 不 对 
输入 、 输 出 队列 进行 常规 冲洗 。 

NOKERNINFO (c_lflag，FreeBSD、Mac OS X) 在 已 设置 时 ， 此 
标志 阻止 STATUS 字符 打印 前 台 进 程 组 的 信息 。 但 是 无 论 是 否 设置 此 标 
志 ，STATUS 字符 都 会 使 SIGINFO 信 号 被 发 送 至 前 台 进 程 组 。 

OCRNL (c_oflag, XSI ` FreeBSD ` Linux ` Solaris) 若 设 置 ， 则 
将 输出 的 CR 字符 转换 成 NL 字符 。 

OFDEL (c_oflag，XSI、Linux、Solaris) 若 设 置 ， 则 输出 填充 字 
符 是 ASCII DEL; 否则 是 ASCII NUL。 见 OFILL 标 志 。 


OFILL (c oflag, XSI^ Linux ^ Solaris) 若 设置 ， 则 传递 填充 字符 

(ASCII DEL 或 ASCIT NUL， 见 OFDEL 标 志 ) 以 实现 延迟 ， 而 不 使 用 

时 间 延 迟 。 见 6 个 延迟 屏蔽 字 标 志 : BSDLY ^ CRDLY ^ FFDLY ^ 
NLDLY、TABDLY 和 VTDLY ° 

OLCUC (c_oflag，Linux、Solaris) 若 设 置 ， 则 将 小 写字 符 转换 成 
RIFA 

NLCR (c oflag, XSI ^ FreeBSD ` Linux ` Mac OS X ` Solaris) # 
设置 ， 将 输出 的 NL 字 符 转 换 成 CR-NL 字 符 。 

ONLRET (c oflag, XSI ^ FreeBSD ` Linux ^ Solaris) 若 设置 ， 则 
假定 输出 的 NL 字符 执行 回 车 功能 。 

ONOCR (c_oflag，XSI、FreeBSD、Linux、Solaris) 若 设 置 ， 则 
在 0 列 不 输出 CR 字符 。 

ONOEOT (c_oflag, FreeBSD ` Mac OS X) 若 设置 ， 则 在 输出 中 
丢弃 EOT (^D) 字符 。 在 某 些 将 Ctrl+D 解 释 为 挂 断 的 终端 上 ， 设 置 此 
标志 可 能 是 必需 的 。 

OPOST (c oflag, POSIX.1 ^ FreeBSD ` Linux ^ Mac OS X ` 
Solaris) 若 设置 ， 则 进行 实现 定义 的 输出 处 理 。 关 于 c_oflag 字 段 的 各 种 
实现 定义 标志 ， 见 图 18-6。 

OXTABS (c oflag, FreeBSD ^ Mac OS X) 若 设 置 ， 则 制 表 符 在 
输出 中 被 扩展 为 空格 。 这 与 将 水 平 制 表 符 延迟 (TABDLY) 设置 为 
XIABS 或 TAB3 所 产生 的 效果 相同 。 

PARENB (c cflag, POSIX.1 ^ FreeBSD ^ Linux ^ Mac OS X ` 
Solaris) 车 设置 ， 则 对 输出 字符 产生 奇偶 位 ， 对 输入 字符 执行 奇偶 校 
验 。 若 已 设置 PARODD， 则 奇偶 校 验 是 奇 校 验 ， 否 则 是 偶 校 验 。 男 见 
对 INPCK、IGNPAR 和 PARMRK 标 志 的 讨论 。 

PAREXT (c cflag, Solaris) 选择 标记 或 空 奇偶 性 。 若 PARODD 设 
置 ， 则 奇偶 位 总 是 1 (标记 奇偶 性 ) ; 否则 ， 奇 侦 位 总 是 0 ( 空 奇偶 


性 ) 

PARMRK (c iflag, POSIX.1 ^ FreeBSD ` Linux ^ Mac OS X ^ 
Solaris) 在 已 设置 时 ， 若 未 设置 IGNPAR ， 则 带 有 结构 出 错 (GE 
BREAK) 的 字 节 或 带 有 奇偶 出 错 的 字 节 将 被 进程 读 作 一 个 3 字符 序列 
\377、\0 和 X， 其 中 X 是 接收 到 的 出 错字 节 。 若 未 设置 ISTRIP， 则 一 个 
有 效 的 \377 被 传送 给 进程 时 为 \377, \377。 若 未 设置 IGNPAR 和 
PARMRK, ， 则 市 有 结构 出 错 谋 或 奇偶 出 错 的 字 闻 都 被 读 作 一 个 字符 
\0° 

PARODD (c_cflag, POSIX.1 ` FreeBSD ` Linux ` Mac OS X ` 
Solaris) 若 设 置 ， 则 输出 和 输入 字符 的 奇偶 性 都 是 奇 ， 否 则 为 侦 。 注 
意 ，PARENB 标志 控制 奇偶 性 的 产生 和 检测 。 

PENDIN (c lflag, FreeBSD ` Linux ^ Mac OS X ` Solaris) 若 设 
置 ， 则 在 下 一 个 字符 输入 时 ， 疝 未 读 的 任何 输入 都 由 系统 重新 打印 。 
这 一 动作 与 键入 REPRINT 字 符 时 的 作用 相 类 似 。 

TABDLY (c oflag, XSI ` Linux ^ Mac OS X ` Solaris) 水 平 制 表 
符 延 迟 屏蔽 字 。 此 屏蔽 字 的 值 是 TAB0、TAB1、TAB2 或 TAB3。 

在 已 设置 CMSPAR 或 PAREXT 标 志 时 ，PARODD 标 志 也 控制 是 否 使 
用 标记 或 空 奇 偶 性 。 

XTABS 的 值 等 于 TAB3。 此 值 使 系统 将 制 表 符 扩展 成 空格 。 系 统 
假定 制 表 符 的 长 度 为 8 个 空格 ， 不 能 更 改 此 假定 。 

TOSTOP (clflag, POSIX.1 ^ FreeBSD ` Linux ^ Mac OS X ` 
Solaris) 若 设 置 ， 并 且 该 实现 支持 作业 控制 ， 则 将 信号 SIGTTOU 送 到 
试图 写 控制 终端 的 一 个 后 台 进 程 的 进程 组 。 按 默认 ， 此 信和 号 暂停 该 进 
程 组 中 所 有 进程 。 如 果 写 控制 终端 的 后 台 进 程 忽略 或 阻塞 此 信号 ， 则 
终端 驱动 程序 不 产生 此 信和 号。 

VTDLY (c oflag, XSI^ Linux ^ Solaris) 垂直 制 表 延迟 屏蔽 字 。 
此 屏蔽 字 的 值 是 VTO 和 VT1。 


XCASE (clflag, Linux ^ Solaris) GiB, HAWKE 
ICANON, ， 则 终端 被 假定 为 只 文 持 大 写字 符 ， 全 部 输入 转换 为 小 写字 
符 。 要 想 输入 一 个 大 写字 符 ， 要 在 其 前 面 加 一 个 反 斜 杠 。 与 之 类 似 ， 
系统 输出 大 写字 符 时 ， 也 要 在 其 前 面 加 一 个 反 斜 枉 。 (如 今 这 个 选项 
标志 已 痉 用 ， 因 为 只 文 持 大 写字 符 的 终端 即使 不 是 全 部 ， 也 是 绝 大 部 
分 都 已 经 不 存在 了 。 ) 


18.6 stty 命 令 


上 市 说 明 的 所 有 选项 都 可 以 被 检查 和 更 改 : 在 程序 中 用 tcgetattr 和 
tcsetattr AY (018.4 5). 进行 检查 和 更 改 ; 在 命令 行 (或 shell 脚 本 ) 
+ Histty(1) an o ETT TS ERU SEPA, o fa) ERU, sty) M S Pæ 18-77 
所 列 的 前 6 个 函数 的 接口 。 如 果 以 -a 选 项 执行 此 命令 ， 则 显示 终端 的 所 
有 选项 : 

$ stty -a 

speed 9600 baud; 25 rows; 80 columns; 

Iflags: icanon isig iexten echo echoe -echok echoke -echonl echoctl 
-echoprt -altwerase -noflsh -tostop -flusho pendin -nokerninfo 
-extproc 

iflags: -istrip icrnl -inlcr -igncr ixon -ixoff ixany imaxbel -ignbrk 
brkint -inpck -ignpar -parmrk 

oflags: opost onlcr -ocrnl -oxtabs -onocr -onlret 

cflags: cread cs8 -parenb -parodd hupcl -clocal -cstopb -crtscts 
-dsrflow -dtrflow -mdmbuf 

cchars: discard = ^O; dsusp = ^Y; eof = ^D; eol = <undef>; 


eol2 = <undef>; erase = ^H; erase? = ^*?; intr = ^C; kill = ^U; 


Inext = ^V; min = 1; quit = ^; reprint = ^R; start = ^Q; 
status = ^T; stop = ^S; susp = ^Z; time = 0; werase = ^W; 
右 在 选项 名 前 有 一 个 连 字 符 ， 表 示 该 选项 共用 。 最 后 4 行 显示 各 终 
端 特殊 字符 ( 见 18.3 节 ) 的 当前 设置 。 第 1 行 显示 当前 终端 窗口 的 行 数 
和 列 数 ，18.12 市 将 对 终端 窗口 大 小 进行 讨论 。 
stty 命 令 使 用 它 的 标准 输入 获得 和 设置 终端 的 选项 标志 。 虽 然 ， 某 
些 较 早 的 实现 使 用 标准 输出 ， 但 POSIX.1 要 求 使 用 标准 输入 。 本 书 讨论 
的 4 种 实现 提供 了 在 标准 输入 上 操作 的 stty 版 本 。 
这 意味 着 如 果 希 望 了 解 名 为 ttyla 的 终端 的 设置 ， 那 么 可 以 键入 
stty -a </dev/ttyla 


术语 波 特 率 (baud rate) 是 一 个 历史 沿用 的 术语 ， 现 在 它 指 的 是 
“位 / 秒 ” (bit per second) 。 昌 然 大 多 数 终端 设备 对 输入 和 输出 使 用 同一 
波 特 率 ， 但 是 只 要 硬件 许可 ， 可 以 将 它们 设置 为 两 个 不 同 值 。 


#include <termios.h> 


speed t cfgetispeed(const struct termios *termptr); 
speed t cfgetospeed(const struct termios *termptr); 
两 个 函数 的 返回 值 : 波 特 率 值 
int cfsetispeed(struct termios *termptr, speed t speed); 
int cfsetospeed(struct termios *termptr, speed t speed); 
两 个 函数 的 返回 值 : AH, GRIGIO; 出错， 返回 -1 
两 个 cfget 芳 数 的 返回 值 ， 以 及 两 个 cfset 范 数 的 speed 参 数 都 是 下 列 
常量 之 一 : B50、 B75、B110、B134、B150、B200、B300、B600、 
B1200、B1800、B2400、B4800、B9600、B19200 或 B38400。 常 量 B0 表 


示 “ 挂 断 ”。 在 调用 tcsetattr 时 ， 如 若 将 输出 波 特 率 指定 为 B0， 则 调制 解 
调 喜 的 控制 线束 不 再 起 作用 。 

大 多 数 系统 定义 了 另外 的 波 特 率 值 ， 如 B57600 以 及 B115250 ° 

使 用 这 些 函 数 时 ， 必 须 认 识 到 输入 、 输 出 波 特 率 是 存储 在 设备 的 
termios 结 构 中 的 ， 如 图 18-8 所 示 。 在 调用 两 个 cfget 函 数 中 的 任意 一 个 之 
前 ， 要 先 用 tcgetattr 获 得 设备 的 termios 结 构 。 与 此 类 似 ， 在 调用 两 个 
cfset 芳 数 中 的 任意 一 个 之 后 ， 要 做 的 就 是 在 termios 结 构 中 设置 波 特 
率 。 为 使 这 种 更 改 影响 到 设备 ， 应 当 调用 tcsetattr 函 数 。 即 使 所 设置 的 
两 个 波 特 率 中 的 任意 一 个 出 错 ， 在 调用 tcsetattr 之 前 可 能 也 不 会 发 现 这 


个 错误 。 
这 4 个 波 特 率 函 数 的 存在 使 应 用 程序 不 必 考 虑 具体 实现 在 termios 结 


构 中 表示 波 特 率 的 不 同方 法 。Linux 和 BSD 派 生 的 平台 趋向 于 存储 波 特 
率 的 数值 。 ( 即 9 600 波 特 率 存储 成 值 9 600) ， 然 而 ，System V 派 生 的 
平台 (如 Solaris) 趋向 于 以 位 屏蔽 方式 编码 波 特 率 。 从 cfget 范 数 得 到 的 
速度 值 以 及 向 cfset 范 数 传 送 的 速度 值 都 未 转换 ， 与 它们 存储 在 termios 
结构 中 的 表示 形式 一 样 。 


18.8 行 控制 函数 


下 列 4 个 函数 提供 了 终端 设备 的 行 控制 能 力 。4 个 函数 都 要 求 参 数 fd 
引用 一 个 终端 设备 ， 否 则 出 销 返 回 -1，errno 设 置 为 ENOTTY。 


#include <termios.h> 


int tcdrain(int fd); 
int tcflow(int fd, int action); 
int tcflush(int fd, int queue); 


int tcsendbreak(int fd, int duration); 


4 个 函数 的 返回 值 : ERD, allo; Amis, E- 

tcdrain 函数 等 待 所 有 输出 都 被 传递 。tcflow 函数 用 于 对 输入 和 输出 
流 控制 进行 控制 。action 参 数 必定 是 下 列 4 个 值 之 一 。 

TCOOFF 输出 被 挂 起 。 

TCOON 重新 启动 以 前 被 挂 起 的 输出 。 

TCIOFF 系统 发 送 一 个 STOP 字 符 ， 这 将 使 终端 设备 停止 发 送 数 
据 。 

TCION 系统 发 送 一 个 START 字 符 ， 这 将 使 终端 设备 恢复 发 送 数 
据 。 

tcflush 函 数 冲洗 MAF) 输入 缓冲 区 (其 中 的 数据 是 终端 驱动 程序 
已 接收 到 ， 但 用 户 程序 尚未 读 取 的 ) 或 输出 缓冲 区 (其 中 的 数据 是 用 
户 程序 已 经 写 入 ， 但 尚未 被 传递 的 ) 。queue 参 数 必 定 是 下 列 3 个 第 量 
之 一 。 

TCIFLUSH 冲洗 输入 队列 。 

TCOFLUSH 冲洗 输出 队列 。 

TCIOFLUSH 冲洗 输入 队列 和 输出 队列 。 

tcsendbreak EN ŽE — A 18 x& AY AY [8] PC [R] A Az 3 xe SE BIO TEE Br o E 
duration 730, MEPR E 3E5:0.25--0.5$^ » POSIX.1Vi B] duration 
非 0， 则 传递 时 间 依 赖 于 实现 。 


18.9 终端 标识 


历史 上 ， 在 大 多 数 UNIX 系 统 版 本 中 ， 控 制 终端 的 名 字 一 直 
是 /dev/tty。POSIX.1 提 供 了 一 个 运行 时 函数 ， 可 用 来 确定 控制 终端 的 名 
F o 


#include <stdio.h> 


char *ctermid(char *ptr); 
返回 值 : AA, TSA TET; ete, EAE 
字符 串 的 指针 
如 果 ptr 非 空 ， 则 被 认为 是 一 个 指针 ， 指 向 长 度 至 少 为 L_ctermid 字 
的 数组 ， 进 程 的 控制 终端 名 存储 在 该 数组 中 。 和 量 L_ctermid 被 定义 
在 <stdio.h> 中 。 者 ptr 是 一 个 空 指 针 ， 则 该 函数 为 数组 (通常 作为 静态 
变量 ) 分 配 空间 。 同 样 ， 进 程 的 控制 终端 名 存储 在 该 数组 中 。 
在 这 两 种 情况 中 ， 该 数组 的 起 始 地 址 都 被 作为 函数 值 返回 。 因 为 
大 多 数 UNIX 系统 都 使 用 /dev/tty 作 为 控制 终端 名 ， 所 以 此 函数 的 主要 
作用 是 改善 向 其 他 操作 系统 的 可 移植 性 。 
当 调用 ctermid 芳 数 时 ， 本 书 说 明 的 所 有 4 种 平台 都 返回 字符 
FR/dev/tty ° 
实例 : ctermidER2 
图 18-12 给 出 的 是 POSIX.1 ctermid 函 数 的 一 个 实现 。 


#include <stdio.h> 
#include <string.h> 


static char  ctermid name[L ctermid]; 
char * 


ctermid(char *str) 


{ 


if (str == NULL) 
str = ctermid_name; 
return(strcpy(str, "/dev/tty")); /* strcpy() returns str */ 


图 18-12 POSIX.1 ctermid ER AXA HM 

TER, AARNE EAA BRE. Arte Ee 
止 过 度 使 用 该 缓冲 区 。 

另外 还 有 两 个 UNIX 系统 比较 感 兴趣 的 函数 : isatty 和 ttyname。 如 
条 文件 摘 述 符 引 用 一 个 终端 设备 ， 则 isatty 返 回 真 。ttyname 返 回 的 是 在 
该 文件 描述 符 上 打开 的 终端 设备 的 路 径 名 。 


#include <unistd.h> 
int isatty(int fd); 
返回 值 : 若 为 终端 设备 ， 返 回 1 (A) ; 否则 ， 返 回 0 (EO 
char *ttyname(int fd); 
返回 值 : 指向 终端 路 径 名 的 指针 ; 者 出 错 ， 返 回 NULL 
实例 : isatty 函 数 
如 图 18-13 所 示 ，isatty KARAD KM o RITR ZIEH TEP 
一 个 终端 专用 函数 《如 果 成 功 执行 ， 它 不 改变 任何 东西 ) ， 并 查看 了 
其 返回 值 。 


#include <termios.h> 


int 
isatty(int fd) 
{ 


struct termios ts; 


return(tcgetattr(fd, &ts) != -1); /* true if no error (is a tty) */ 


图 18-13 POSIX.1 isatty E ZB] Sz E 


使 用 图 18-14 中 的 程序 测试 isatty 画 数 。 


#include "apue.h" 


int 
main (void) 


{ 


printf("fd 0: $sWXn", isatty(0) 9? "tty" 3 "not a tty"); 
printf("fd.1i SN yy dsatty(l) ?'"tty" i "not a tty"); 
printf("fd 2: $sXn", isatty(2) ? "tty" = "not a tty"); 
exit(0); 


图 18-14 测试 isatty 函 数 
运行 图 18-14 中 的 程序 ， 得 到 如 下 输出 : 
$ ./a.out 

fd 0: tty 


fd 1: tty 

fd 2: tty 

$ /a.out </etc/passwd 2>/dev/null 

fd 0: not a tty 

fd 1: tty 

fd 2: not a tty 

实例 : ttyname kK Zk 

ttyname ENA ( 见 图 18-15) 比较 长 ， 因 为 它 要 搜索 所 有 设备 表 项 ， 
寻找 匹配 项 。 


#include 


<sys/stat.h> 


#include <dirent.h> 
#include <limits.h> 
#include <string.h> 
#include <termios.h> 
#include <unistd.h> 
#include <stdlib.h> 


struct devdir { 
struct devdir 
char 


static struct devdir 
static struct devdir 
static char 


static void 
add(char *dirname) 


{ 


*d next: 
*d name; 


*head; 
REATI 
pathname[ POSIX PATH MAX + 1]; 


struct devdir *ddp; 
int len; 
len = strlen(dirname); 

/* 

* Skip)... «oa, Anad /dev/td. 
x 


if ((dirname[len-1] == 
(dirname[len-2] 


LADY 


&& dirname[len-3] == 


&& (dirname[len-2] == 


rot 


return; 
if (strcmp(dirname, "/dev/fd") == 0) 
return; 
if ((ddp = malloc (sizeof (struct devdir))) == NULL) 
return; 
if ((ddp->d_name = strdup(dirname)) == NULL) { 
free (ddp); 
return; 
) 
ddp-»d next = NULL; 
if (tail -- NULL) ( 
head = ddp; 
tail = ddp; 
) else { 


tail-»d next 


tail = ddp; 


Static void 
cleanup (void) 
{ 


struct devdir 


= ddp; 


*ddp, *nddp; 


ddp = head; 

while (ddp != NULL) { 
nddp = ddp->d_next; 
free (ddp->d_name) ; 
free (ddp); 
ddp = nddp; 


head = NULL; 
tail = NULL; 


statie char * 
searchdir(char *dirname, struct stat *fdstatp) 


{ 


struct stat devstat; 
DIR *dp; 

int devlen; 
struct dirent *dirp; 


strcpy(pathname, dirname); 

if ((dp = opendir(dirname)) == NULL) 
return (NULL); 

strcat(pathname, "/"); 

devlen = strlen(pathname); 

while ((dirp = readdir(dp)) != NULL) { 
strncpy(pathname + devlen, dirp->d name, 

POSIX PATH MAX - devlen); 


/* 

* Skip aliases. 

af 

if (strcmp(pathname, "/dev/stdin") == 0 || 
strcmp(pathname, "/dev/stdout") == 0 || 
strcmp(pathname, "/dev/stderr") == 0) 

continue; 
if (stat(pathname, &devstat) < 0) 


continue; 
if (S ISDIR(devstat.st mode)) { 
add (pathname) ; 


continue; 
} 
if (devstat.st_ino == fdstatp->st_ino && 
devstat.st_dev == fdstatp->st_dev) { /* 


closedir (dp); 
return(pathname); 


closedir (dp); 
return (NULL); 


char * 
ttyname(int fd) 


( 


found a match */ 


struct stat fdstat; 
struct devdir *ddp; 
char *rval; 


if (isatty(fd) == 0) 
return (NULL); 

if (fstat(fd, &fdstat) < 0) 
return (NULL 

if (S_ISCHR(fdstat.st_mode) == 0) 
return (NULL); 


£ 


rval = searchdir("/dev", &fdstat); 
if (rval == NULL) { 
for (ddp = head; ddp != NULL; ddp = ddp->d_next) 
if ((rval = searchdir(ddp->d_name, &fdstat)) != NULL) 
break; 
} 
cleanup(); 


return (rval); 


118-15 POSIX.1 ttyname K ALA Sz 9l 


此 处 使 用 的 技术 是 读 /dev 目 未 ， 寻 找 具 有 相同 设备 号 和 iT 点 编号 
的 表 项 。 回 忆 4.24 方 ， 每 个 文件 系统 都 有 一 个 唯一 的 设备 号 (stat 结构 
中 的 st dev 字段 ， 见 4.2 节 ) ， 文 件 系 统 中 的 每 个 目录 项 都 有 一 个 唯一 
的 i 节点 编号 (stat 结构 中 的 stino 字段 )。 在 此 函数 中 ， 假 定 在 找到 
一 个 匹配 的 设备 号 和 匹配 的 i 节点 号 时 ， 束 能 找到 所 希望 的 目录 项 。 也 
能 验证 这 两 个 表 项 与 st_rdev 字段 (终端 设备 的 主 设备 号 和 次 设备 号 ) 
相 人 匹配 ， 还 能 验证 该 目录 项 是 一 个 字符 特殊 文件 。 但 是 ， 因 为 已 经 验 
证 了 文件 摘 述 符 参 数 既 是 一 个 终端 设备 ， 义 是 一 个 字符 特殊 文件 ， 而 
且 因 为 在 UNIX 系 统 中 ， 匹 配 的 设备 号 和 i 六 点 编号 是 唯一 的 ， 所 以 不 再 
需要 进行 男 外 的 比较 。 

终端 名 可 能 在 /dev 的 子 目 录 中 。 于 是 ， 需 要 搜索 /dev 下 的 整个 文件 
系统 树 。 我 们 跳 过 了 少数 几 个 可 能 会 产生 不 正确 结果 或 奇怪 结 采 的 目 
录 : /dev. ^ /dev/.. 和 /devfd 。 我 们 也 跳 过 了 一 些 别 
名 : /dev/stdin、/dev/stdout 以 及 /dev/stderr， 因 为 它们 是 /dev/fd 目 隶 中 文 
件 的 符号 链接 。 


使 用 图 18-16 中 的 程序 测试 这 一 实现 。 


#include "apue.h" 


int 


main (void) 


( 


char *name; 
if (isatty(0)) { 


name = ttyname (0); 
if (name == NULL) 
name = "undefined"; 


} else { 


} 


name = "not a tty"; 


printf("fd 0: s\n", name); 


if (isatty(1)) { 
name = ttyname(1); 


if (name == NULL) 
name = "undefined"; 
} else { 
name = "not a tty"; 


} 


printf("fd 1: s\n", name); 


if (isatty(2)) { 
name = ttyname (2); 


if (name == NULL) 
name = "undefined"; 
} else { 
name = "not a tty"; 


} 


printf("fd 2: s\n", name); 


exit (0); 


图 18-16 jl ixkttyname£K RL 


运行 图 18-16 中 的 程序 ， 得 到 : 


$ ./a.out < /dev/console 2> /dev/null 


fd 0: /dev/console 
fd 1: /dev/ttys001 
fd 2: not a tty 


18.10 规范 模式 


规范 模式 很 简单 ， 发 一 个 读 请 求 ， 当 一 行 已 经 输入 后 ， 终 端 驱 动 
程序 即 返回 。 以 下 几 个 条 件 造 成 读 返 回 。 

* 所 请 求 的 字 节 数 已 读 到 时 ， 读 返回 。 无 需 读 一 个 完整 的 行 。 如 果 
读 了 部 分 行 ， 那 么 也 不 会 丢失 任何 信息 ， 下 一 次 读 从 前 一 次 读 的 停止 
处 开始 。 

“ 当 读 到 一 个 行 定 界 符 时 ， 读 返回 。 回 忆 18.3 节 ， 在 规范 模式 中 ， 
下 列 字 符 被 解释 为 “ 行 结束 ”: NL、EOL、EOL2 和 EOF。 男 外 ， 在 18.5 
节 中 也 曾 说 明 ， 如 若 已 设置 ICRNL， 但 未 设置 IGNCR， 则 CR 字符 的 作 
用 与 NL 字符 一 样 ， 也 终止 一 行 。 

在 这 5 个 行 界定 符 中 ， 只 有 一 个 EOF 符 在 终端 驱动 程序 对 其 进行 处 
理 后 即 被 丢弃 。 其 他 4 个 字符 则 作为 其 所 处 行 的 最 后 一 个 字符 返回 给 调 
用 者 。 

如 果 捕 捉 到 信号 ， 并 且 该 函数 不 再 自动 重启 ( 见 10.5 节 ) ， 则 读 
也 返回 。 

实例 : getpass Nav 

下 面 说 明 getpass 函 数 ， 它 读 入 用 户 在 终端 上 键入 的 口令 。 此 函数 
由 login(1D) 和 crypt(1) 程 序 调用 。 为 了 读 取 口令 ， 该 函数 必须 关闭 回 显 ， 
但 仍 可 使 终端 以 规范 模式 进行 工作 ， 因 为 不 管 键入 什么 作为 口令 都 能 
构成 一 个 完整 行 。 图 18-17 显 示 了 UNIX 系 统 中 的 一 个 典型 实现 。 


#include <signal.h> 


#include <stdio.h> 

#include <termios.h> 

#define MAX PASS LEN 8 /* max #chars for user to enter */ 
char * 


getpass(const char *prompt) 
{ 


static char buf[MAX PASS LEN + 1]; /* null byte at end */ 
char tatry 

sigset_t sig, osig; 

Struct termios ts, ots; 

FILE *fp; 

int C; 

if ((fp = fopen(ctermid(NULL), "r*")) == NULL) 


return (NULL); 
setbuf(fp, NULL); 


sigemptyset(&sig); 


sigaddset(&sig, SIGINT); /* block SIGINT */ 
sigaddset (&sig, SIGTSTP); /* block SIGTSTP */ 
sigprocmask(SIG BLOCK, &sig, &osig); /* and save mask */ 
tcgetattr(fileno(fp), &ts); /* save tty state */ 
ots = ts; /* structure copy */ 


ts.c lflag &= ~(ECHO | ECHOE | ECHOK | ECHONL); 
tcsetattr(fileno(fp), TCSAFLUSH, &ts); 
fputs (prompt, fp); 


ptr = buf; 
while ((c = gete(fp)) != EOF && c != Nn") 
if (ptr < &buf[MAX PASS LEN]) 
*ptrtt = c; 
*ptr = 0; /* null terminate */ 
puüte('Ni', fp)? /* we echo a newline */ 


tcsetattr(fileno(fp), TCSAFLUSH, &ots); /* restore TTY state */ 
Sigprocmask(SIG SETMASK, &osig, NULL); /* restore mask */ 
fclose (fp); /* done with /dev/tty */ 

return (buf); 


图 18-17 getpass 函 数 的 实现 


在 此 例 中 ， 应 当 考 虑 以 下 几 个 方面 。 
“调用 ctermid 函 数 打开 控制 终端 ， 而 不 是 直接 将 /dewtty 写 在 程序 
中 o 


“只 是 读 、 写 控制 终端 ， 如 采 不 能 以 读 、 写 模式 打开 此 设备 则 出 错 
返回 。 还 有 一 些 其 他 的 使 用 约定 。 在 GNU CHUENE, ARA BÉ 
以 读 、 写 模式 打开 控制 终端 ， 则 getpass 读 取 标 准 输入 ， 写 到 标准 错 
误 。 在 Solaris 版 本 中 ， 如 果 不 能 打开 控制 终端 ， 则 getpass 失 败 。 

“阻塞 两 个 信号 SIGINT 和 SIGTSTP。 如 果 不 这 样 做 ， 在 输入 INTR 
字符 时 就 会 使 程序 异常 中 止 ， 并 使 终端 仍 处 于 禁止 回 显 状态 。 与 此 相 
类 似 ， 输 入 SUSP 字符 时 将 使 程序 停止 ， 并 且 在 禁止 回 显 状态 下 返回 
到 shel。 在 禁止 回 显 时 ， 我 们 选择 了 阻 守 这 两 个 信号 。 如 有 果 这 两 个 信 
号 是 在 读 取 口令 期 间 产 生 的 ， 则 它们 会 一 直 被 保持 ， 直 到 getpass 返 
回 ， 阻 塞 才 会 解除 。 也 有 其 他 方法 来 处 理 这 些 信号 。 有 些 getpass 版 本 
忽略 SIGINT 〈 保 存 它 以 前 的 动作 ) ， 在 返回 前 将 其 动作 恢复 为 以 前 的 
值 。 这 就 意味 着 ， 在 该 信号 被 忽略 期 间 所 发 生 的 这 种 信号 都 会 丢失 。 
其 他 版 本 捕捉 SIGINT (保存 它 以 前 的 动作 ) ， 如 果 捕 捉 到 此 信号 ， 则 
在 恢复 终端 状态 和 信号 动作 后 ， 用 ki 函数 发 送 此 信号 。 没 有 一 个 
getpass 版 本 捕捉 、 名 略 或 阻塞 SIGQUIT， 所 以 输入 QUIT 字 符 融 会 使 程 
序 异 常 中 止 ， 并 且 很 可 能 使 终端 保持 在 禁止 回 显 状态 。 

。 请 注意 ， 某 些 shell， 尤 其 是 Korn shell， 在 以 交互 方式 读 输 入 时 都 
使 终端 处 于 回 显 状态 。 这 些 shel] 是 提供 命令 行 编辑 的 shell， 因 此 在 每 次 
输入 一 条 交互 命令 时 都 处 理 终端 状态 。 所 以 如 采 在 这 种 shell 下 调用 此 
程序 ， 并 且 用 QUIT 字 符 使 其 异常 中 止 ， 则 这 种 shell 可 能 会 恢复 回 显 状 
态 。 其 他 不 提供 命令 行 编辑 的 shell (“Bourne shell) 将 使 程序 异常 中 
止 ， 并 使 终端 你 持 在 不 回 显 状态 。 如 采 对 终端 做 了 这 种 操作 ， 则 stty 命 
令 能 使 终端 恢复 到 回 显 状态 。 

“使 用 标准 IO 读 、 写 控制 终端 。 我 们 特地 将 流 设置 为 不 市 缓 神 的 ， 
否则 在 流 的 读 、 写 之 间 可 能 会 有 某 些 交叉 〈 这 样 承 需要 多 次 调用 
fflush) 。 也 可 使 用 不 带 缓 冲 的 UO 〈 见 第 3 章 ) ， 但 是 在 这 种 情况 下 就 
只 能 用 read 来 模仿 getc 函 数 。 


最 多 只 存储 8 个 字符 作为 口令 。 输 入 的 其 他 多 余 字 符 则 全 部 被 忽 
HA o 

图 18-18 中 的 程序 调用 getpass 并 且 打 印 我 们 输入 的 内 容 。 这 是 为 了 
验证 ERASE 和 KILL 字 符 能 否 正常 工作 (如 同 它们 在 规范 模式 下 应 该 表 
现 的 那样 ) 。 


char *getpass(const char *); 


int 
main (void) 
{ 
char ROET 


if ((ptr = getpass ("Enter password:")) == NULL) 
err sys("getpass error"); 
printf("password: %s\n", ptr); 


/* now use password (probably encrypt it) ... */ 
while (*ptr !- 0) 

*ptr++ = 0; /* zero it out when we're done with it */ 
exit (0); 


图 18-18 Val H getpass NAL 


如 果 调 用 getpass 函数 的 程序 使 用 的 是 明文 口令 ， 那 么 为 了 安全 起 
， 在 程序 完成 后 应 在 内 存 中 清除 它 。 如 果 该 程序 会 产生 其 他 用 户 可 
读 取 的 core 文 件 〈 回 忆 10.2 节 ，core 的 系统 默认 许可 权 使 每 个 用 户 都 
读 它 ) ， 或 者 如 果 某 个 其 他 进程 能 够 设法 读 该 进程 的 存储 空间 ， 则 
们 就 可 能 会 读 到 这 个 明文 口令 。 (“明文 ”是 指 我 们 在 getpass 打印 的 
提示 符 处 键入 的 口令 。 大 多 数 UNIX 系 统 程序 会 对 这 个 明文 口令 进行 修 
改 ， 将 它 转换 成 一 个 “加 密 * 口 令 。 例 如 ， 口 令 文件 ( 见 6.2 节 ) 中 的 
pw_passwd 字 段 包 含 的 是 加 密 口令 ， 而 不 是 明文 口令 。) 


m x) x) el 


18.11 非 规范 模式 


可 以 通过 关闭 termios 结 构 中 c_lflag 字 段 的 ICANON 标 志 来 指定 非 规 
苑 模式 。 在 非 规 范 模 式 中 ， 输 入 数据 不 装配 成 行 ， 不 处 理 下 列 特殊 字 
^j (0.18.37) : ERASE ` KILL ` EOF ` NL ` EOL ` EOL2 ` CR ` 
REPRINT ` STATUSTIWERASE ° 

如 前 所 述 ， 规 范 模 式 很 容易 理解 : 系统 每 次 至 多 返回 一 行 。 但 在 
非 规范 模式 下 ， 系 统 如 何 知 道 在 什么 时 候 将 数据 返回 给 我 们 呢 ? 如 果 
它 一 次 返回 一 个 字 节 ， 那 么 系统 开销 就 会 过 大 。 (回忆 图 3-6， 从 中 可 
以 看 到 每 次 读 一 个 字 节 的 开销 有 多 大 。 如 果 每 次 返回 的 数据 加 倍 ， 那 
么 系统 调用 的 开销 就 可 以 减 半 。) 在 局 动 读数 据 之 前 ， 往 往 不 知道 要 
读 多 少数 据 ， 所 以 系统 不 能 总 是 一 次 返回 多 个 字 市 。 

解决 方法 是 ， 当 已 读 了 指定 量 的 数据 后 ， 或 者 已 经 超过 了 给 定量 
的 时 间 后 ， 即 通知 系统 返回 。 这 种 技术 使 用 了 termios 结 构 中 c_cc 数 组 的 
两 个 变量 : MIN 和 TIME 。c_cc 数 组 中 的 这 两 个 元 素 的 下 标 名 为 VMIN 
和 VTIME ° 

MIN#8 4E — “reads [El Bi B] g^] NE Bo TIMES AE Sé PTE BIA 
的 分 秒 数 (分 秒 为 秒 的 /10) 。 有 下 列 4 种 情形 。 

情形 A: MIN>0, TIME>0 

TIME 指 定 一 个 字 节 间 定 时 器 (interbyte timer) ， 它 只 在 第 一 个 字 
节 被 接收 时 启动 。 

在 该 定时 器 超时 之 前 ， 若 已 接 到 MIN 个 字 节 ， 则 read 返 回 MIN 个 字 
T ° URE 

接 到 MIN 5E B Z Bi, WEN ae RAY, Wreads E C £u BI AY 
字 节 。 (因为 定 


时 器 是 在 第 一 个 字 节 被 接收 后 启动 的 ， 所 以 在 定时 器 超时 时 ，read 
至 少 会 返回 一 

^W) 在 这 种 情形 中 ， 第 一 个 字 节 被 接收 之 前 ， 调 用 者 会 一 
直 阻 塞 。 如 果 在 调 

用 read 时 数据 已 经 可 用 ， 则 就 如 同 在 read 后 数据 被 立即 接收 了 一 
样 。 

情形 B: MIN>0, TIME--0 

read 在 接收 到 MIN 个 字 和 之 前 不 返回 。 这 会 造成 read 无 限期 阻塞 。 

情形 C: MIN==0，TIME>0 

TIME 指 定 一 个 调用 read 时 启动 的 读 定 时 器 。 (与 情形 A 相 比 较 ， 
两 者 是 不 同 的 。 

在 情形 A 中 ， 非 0 TIME 表 示 字 市 间 定时 器 ， 该 定时 器 要 等 到 第 一 
个 字 市 被 接收 时 

才 启 动 。) 在 接 到 一 个 字 节 或 者 该 定时 器 超时 时 ，read 即 返回 。 如 
果 是 定时 器 超时 ， 

则 read 返 回 0 ° 

情形 D: MIN==0，TIME==0 

如 果 有 数据 可 用 ， 则 read 最 多 返回 所 要 求 的 字 节 数 。 如 果 无 数据 
可 用 ， 则 read 

立即 返回 0。 

在 所 有 这 些 情 形 中 ，MIN 只 是 最 小 值 。 如 果 程 序 要 求 的 数据 多 于 
MIN 个 字 节 ， 那 么 它 或 许 能 接收 到 所 要 求 的 字 节 数 。 这 也 适用 于 
MIN==0 的 情形 C 和 情形 D。 

图 18-19 总 结 并 列 出 了 非 规范 模式 输入 的 4 种 不 同情 形 。 在 这 个 图 
中 ，nbytes 是 read 的 第 三 个 参数 (返回 的 最 大 字 节 数 ) 。 


MIN > 0 MIN == 0 


A: 在 定时 器 超时 前 ， C: 在 定时 器 超时 前 ， 
read 返回 [MIN, nbytes]; read 返回 [1, nbytes]; 
ES 如 果 定 时 器 超时 ， 如 采 定 时 器 超时 ， 
read 返回 [1,MIN]。 read 返回 0. 
(TIME= 字 节 间 定时 器 。 (TIME=read 定时 器 。) 
调用 者 会 无 限期 阻塞 。) 
B: 当 有 可 用 数据 时 ， D: read 立即 返回 [0, nbytes]. 
TIME == 0 read 返回 [MIN, nbytes]. 


〈 调 用 者 可 无 限期 阻塞 。) 


图 18-19 非 规范 输入 的 4 种 情形 


请 注意 ，POSIX.1 人 允许 下 标 VMIN 和 VTIME 的 值 分 别 与 VEOF 和 
VEOL 的 相同 。 确 实 ，Solaris 吏 是 这 样 做 的 ， 这 样 殴 提 供 了 与 System V 
的 早期 版 本 的 兼容 性 。 但 是 ， 这 也 带 来 了 可 移植 性 问题 。 从 非 规 范 模 
式 转 换 为 规范 模式 时 ， 必 须 恢复 VEOF 和 VEOL。 如 果 VMIN 等 于 
VEOF， 且 不 恢复 它们 的 值 ， 那 么 当 把 VMIN 的 典型 值 设置 为 1 时 ， 文 件 
结束 符 就 变 成 了 Ctrlt+A。 解 决 这 一 问题 最 简单 的 方法 是 : 在 要 转 入 非 规 
玫 模 式 时 ， 将 整个 termios 结 构 你 存 起 来 ， 以 后 再 要 转 回 规范 模式 时 恢 
BE ° 

实例 

图 18-20 中 的 程序 定义 了 函数 tty_cbreak 和 tty_raw， 它 们 将 终端 分 别 
设置 为 cbreak 模 式 (cbreak mode) 和 原始 模式 (raw mode) 。 (术语 
cbreak 和 原始 来 自 于 V7 的 终端 驱动 程序 。) tty_reset 函 数 的 功能 是 将 终 
端 恢复 到 原始 的 工作 状态 (也 就 是 调用 tty_cbreak 或 tty_raw 之 前 的 工作 
状态 ) 。 

如 果 已 调用 tty_cbreak ， 那 么 在 调用 tty raw 之 前 需要 调用 
tty_reset。 如 果 已 调用 tty_raw， 然 后 又 要 调用 tty_cbreak， 那 么 在 此 之 
前 同样 也 要 调用 tty_reset。 这 减少 了 出 销 时 终端 处 于 不 可 用 状态 的 机 


会 。 


该 程序 还 提供 了 另外 两 个 函数 : tty atexit?ltty termios ° tty. atexit 
可 被 登记 为 退出 处 理 程 序 ， 以 保证 exit 恢复 终端 工作 模式 。tty_termios 
则 返回 一 个 指 回 原来 规范 模式 下 termios 结 构 的 指针 。 
— 


#include «termios.h» 
#include <errno.h> 


static struct termios save_termios; 
static int ttysavefd = -1; 
static enum { RESET, RAW, CBREAK } ttystate = RESET; 
int 
tty_cbreak(int fd) /* put terminal into a cbreak mode */ 
{ 
int err; 
struct termios buf; 
if (ttystate != RESET) { 


errno = EINVAL; 
return (-1); 


} 
if (tcgetattr(fd, &buf) < 0) 
return (-1); 


save_termios = buf; /* structure copy */ 
/* 

* Echo off, canonical mode off. 

x 


buf.c lflag &= ~(ECHO | ICANON); 


/* 

* Case B: 1 byte at a time, no timer. 

X 

buf.c cc[VMIN] = 1; 

buf.c cc[VTIME] = 0; 

if (tcsetattr(fd, TCSAFLUSH, &buf) « 0) 
return(-1); 


/* 
* Verify that the changes stuck. tcsetattr can return 0 on 
* partial success. 

a 
if (tcgetattr(fd, &buf) < 0) { 
err = errno; 
tcsetattr(fd, TCSAFLUSH, &save_termios) ; 
errno = err; 
return (-1); 
} 


if ((buf.c_lflag & (ECHO | ICANON)) || buf.c_cc[VMIN] != 1 || 
buf.c_cc[VTIME] != 0) { 
/* 


* Only some of the changes were made. Restore the 
* original settings. 

xA 

tcsetattr(fd, TCSAFLUSH, &save termios); 

errno - EINVAL; 

return(-1); 


ttystate - CBREAK; 
ttysavefd - fd; 


return(0); 
} 
int 
tty_raw(int fd) /* put terminal into a raw mode */ 
{ 
int err; 
struct termios Dues 


if (ttystate != RESET) { 
errno = EINVAL; 
return(-1); 

} 

if (tcgetattr(fd, &buf) < 0) 


return(-1); 
save termios - buf; /* structure copy */ 


/* 

* Echo off, canonical mode off, extended input 
* processing off, signal chars off. 

mi 
buf.c_lflag &= ~(ECHO | ICANON | IEXTEN | ISIG); 


/* 
* No SIGINT on BREAK, CR-to-NL off, input parity 

* check off, don't strip 8th bit on input, output 

* flow control off. 

Ey 

buf.c_iflag &= ~(BRKINT | ICRNL | INPCK | ISTRIP | IXON); 


/* 
* Clear size bits, parity checking off. 
xy 

buf.c cflag &= ~(CSIZE | PARENB); 


/* 
* Set 8 bits/char. 
xu 
buf.c cflag |= CS8; 


/* 
* Output processing off. 
i 
buf.c oflag &= -(OPOST); 


/* 
* Case B: 1 byte at a time, no timer. 
*/ 

buf.c cc[VMIN] = 1; 


buf.c cc[VTIME] = 0; 
if (tcsetattr(fd, TCSAFLUSH, &buf) < 0) 
return (-1) ; 


/* 
* Verify that the changes stuck. tcsetattr can return 0 on 
* partial success. 
d 
if (tcgetattr(fd, &buf) < 0) { 
err - errno; 
tcsetattr(fd, TCSAFLUSH, &save termios); 
errno - err; 
return(-1); 
} 
if ((buf.c_lflag & (ECHO | ICANON | IEXTEN | ISIG)) || 
(buf.c_iflag & (BRKINT | ICRNL | INPCK | ISTRIP | IXON)) || 


(buf.c_cflag & (CSIZE | PARENB | CS8)) != CS8 || 
(buf.c oflag & OPOST) || buf.c cc[VMIN] != 1 |I 
buf.c cc[VTIME] != 0) { 


/* 


* Only some of the changes were made. Restore the 
* original settings. 

y, 

tcsetattr(fd, TCSAFLUSH, &save termios); 

errno - EINVAL; 

return(-1); 


) 


ttystate - RAW; 
ttysavefd = fd; 


return (0); 
} 
int 
tty reset(int fd) /* restore terminal's mode */ 
( 
if (ttystate == RESET) 
return(0); 


if (tcsetattr(fd, TCSAFLUSH, &save termios) « 0) 
return(-1); 

ttystate - RESET; 

return(0); 


} 


void 
tty_atexit (void) /* can be set up by atexit(tty_atexit) */ 
{ 
if (ttysavefd >= 0) 
tty reset(ttysavefd); 
) 


struct termios * 
tty termios (void) /* let caller see original tty state */ 
{ 

return (&save_termios) ; 


} 


图 18-20 将 终端 模式 设置 为 cbreak 模 式 或 原始 模式 


cbreak 模 式 的 定义 如 下 。 

“ 非 规范 模式 。 如 本 节 开 始 处 所 述 ， 这 种 模式 关闭 了 对 某 些 输入 字 
符 的 处 理 。 这 种 模式 没有 关闭 对 信号 的 处 理 ， 所 以 用 户 始 终 可 以 键入 
一 个 能 够 触发 终端 产生 信号 的 字符 。 请 注意 ， 调 用 者 应 当 捕捉 这 些 信 
号 ， 否 则 这 种 信号 束 有 可 能 终止 程序 ， 并 且 使 终端 保持 在 cbreak 模 式 。 

作为 一 般 规 则 ， 在 编写 更 改 终端 模式 的 程序 时 ， 应 当 捕 捉 大 多 数 
信号 ， 以 便 在 程序 终止 前 恢复 终端 模式 。 


“关闭 回 显 。 
.每 次 输入 一 个 字 节 。 为 此 ， 将 MIN 设 置 为 1， 将 TIME 设 置 为 0° 这 
是 图 18-19 中 的 情形 B。 人 至 少 有 一 个 字 节 可 用 时 ，read 才 返回 。 

对 原始 模式 的 定义 如 下 。 

“ 非 规范 模式 。 也 关闭 了 对 信和 号 产生 字符 (ISIG) 和 扩充 输入 字符 
(IEXTEN) 的 处 理 。 

另外 还 禁用 了 BRKINT 字 符 ， 使 BREAK 字 符 不 再 产生 信和 号 。 

“关闭 回 显 。 

“禁止 输入 中 的 CR 到 NL 映射 (ICRNL ) 、 输 入 奇偶 检测 
(INPCK) 、 剥 离 输 入 字 节 的 第 8 位 (ISTRIP) 以 及 输出 流 控 制 
(IXON) ° 

“8 位 字符 (CS8) ， 且 禁用 奇偶 校 验 (PARENB) 

"禁止 所 有 输出 处 理 (OPOST) 

“每 次 输入 一 个 字 节 (MIN=1，TIME=0) 

图 18-21 中 的 程序 测试 原始 模式 和 cbreak 模 式 。 


finclude "apue.h" 


Static void 

sig catch(int signo) 

{ 
printf("signal caught\n"); 
tty reset(STDIN FILENO); 
exit (0); 


int 
main (void) 


( 


int ij 

char us 

if (signal(SIGINT, sig catch) == SIG ERR) /* catch signals */ 
err Ssys("signal(SIGINT) error"); 

if (signal(SIGQUIT, sig catch) == SIG ERR) 
err sys("signal(SIGQUIT) error"); 

if (signal(SIGTERM, sig catch) == SIG ERR) 


err sys("signal(SIGTERM) error"); 


if (tty raw(STDIN FILENO) « 0) 
err sys("tty raw error"); 
printf("Enter raw mode characters, terminate with DELETE Wn"); 


while ((i = read(STDIN FILENO, &c, 1)) == 1) { 
if ((c &= 255) == 0177) /* 0177 = ASCII DELETE */ 
break; 


printf("$0oMn", c); 
} 
if (tty_reset(STDIN_FILENO) < 0) 
err_sys("tty_reset error"); 
df (£ <= 0) 
err_sys("read error"); 
if (tty cbreak(STDIN FILENO) < 0) 
err sys("tty cbreak error"); 
printf ("\nEnter cbreak mode characters, terminate with SIGINT\n"); 
while ((i = read(STDIN FILENO, &c, 1)) == 1) { 
c &= 255; 
Prinks (GN d; 
} 
if (tty reset(STDIN FILENO) < 0) 


err sys("tty reset error"); 
if (i <= 0) 
err sys("read error"); 


exit(0); 


图 18-21 测试 原始 终端 模式 和 cbreak 终 端 模 式 


运行 图 18-21 中 的 程序 ， 可 以 观察 这 两 种 终端 工作 模式 的 工作 情 
ihi o 
$ /a.out 


Enter raw mode characters, terminate with DELETE 


4 
33 
133 
61 
70 
176 
REA Delete 
Enter cbreak mode characters, terminate with SIGINT 
1 键入 Ctrl+A 
10 键入 退 格 
signal caught BEA FT BE 


在 原始 模式 中 ， 输 入 的 字符 是 Ctrl+D (04) 和 特殊 功能 键 F7。 在 
所 用 的 终端 上 ， 此 功能 键 产 生 5 个 字符 : ESC (033) 、[ (0133) ^1 
(061) 、8 (070) #07 (0176) 。 注 意 ， 在 原始 模式 下 关闭 了 输出 处 理 
(“OPOST) ， 所 以 在 每 个 字符 后 没有 得 到 回 车 符 。 另 外 还 要 注意 的 
是 ， 在 cbreak 模 式 下 ， 不 对 输入 特殊 字符 进行 处 理 (因此 没 对 Ctrl+D ` 
文件 结束 符 和 退 格 进行 特殊 处 理 ) ， 但 是 仍 对 终端 产生 的 信号 进行 处 
HH o 


18.12 终端 窗口 大 小 


大 多 数 UNIX 系 统 都 提供 了 一 种 跟 踩 当前 终端 窗口 大 小 的 方法 ， 在 
窗口 大 小 发 生变 化 时 ， 使 内 核 通 知 前 台 进 程 组 。 内 核 为 每 个 终端 和 伪 
Vm DAI? T — 1 winsizeZitÀ: 


struct winsize { 


unsigned short ws row; /* rows, in characters */ 

unsigned short ws col; /* columns, in characters */ 
unsigned short ws xpixel; /* horizontal size, pixels (unused) */ 
unsigned short ws ypixel; /* vertical size, pixels (unused) */ 

y 


此 结构 的 规则 如 下 。 

“用 ioct] ( 见 3.15 节 ) 的 TIOCGWINSZ 命 令 可 以 取 此 结构 的 当前 
值 。 

“用 ioctl 的 TIOCSWINSZ 命令 可 以 将 此 结构 的 新 值 存储 到 内 核 
中 。 如 果 此 新 值 与 存储 在 内 核 中 的 当前 值 不 同 ， 则 前 台 进 程 组 会 收 到 
SIGWINCH 信 号 。 (注意 ， 从 图 10-1 中 可 以 看 出 ， 此 信和 号 的 系统 默认 动 
作 是 被 忽略 。) 

"除了 存储 此 结构 的 当前 值 以 及 在 此 值 改变 时 产生 一 个 信号 以 外 ， 
内 核对 该 结构 不 进行 任何 其 他 操作 。 对 结构 中 的 值 进行 解释 完全 是 应 
用 程序 的 工作 。 

提供 这 种 功能 的 目的 是 ， 当 窗口 大 小 发 生变 化 时 应 用 程序 能 够 得 
到 通知 (如 vi 编辑 器 ) 。 应 用 程序 接收 此 信号 后 ， 可 以 获取 窗口 大 小 的 
新 值 ， 然 后 重 绘 屏幕 。 

实例 

图 18-22 所 示 的 程序 打印 当前 窗口 大 小 ， 然 后 休眠 。 每 次 窗口 大 小 
改变 时 ， 程 序 就 捕捉 到 SIGWINCH 信 和 号， 然后 打印 新 的 窗口 大 小 。 我 
们 必须 用 一 个 信号 终止 此 程序 。 


#include "apue.h" 
#include <termios.h> 
#ifndef TIOCGWINSZ 
#include <sys/ioctl.h> 
#endif 


static void 
pr_winsize(int fd) 
{ 


struct winsize size; 


if (ioctl(fd, TIOCGWINSZ, (char *) &size) « 0) 
err Sys("TIOCGWINSZ error"); 
printf("$d rows, $d columns\n", size.ws row, size.ws col); 


Static void 

Sig winch(int signo) 

( 
printf("SIGWINCH received\n") ; 
pr_winsize (STDIN_FILENO) ; 


int 
main (void) 


{ 


if (isatty(STDIN_FILENO) == 0) 
exit(1); 
if (signal(SIGWINCH, sig winch) == SIG ERR) 
err sys("signal error"); 
pr winsize(STDIN FILENO); /* print initial size */ 
for $7 y. /* and sleep forever */ 
pause(); 


图 18-22 打印 窗口 大 小 
在 一 个 带 窗 口 终端 的 系统 上 运行 图 18-22 中 的 程序 得 到 : 
$ ./a.out 
35 rows, 80 columns 初始 大 小 
SIGWINCH received 更 改 窗口 大 
小 : 捕捉 到 信和 号 
40 rows, 123 columns 
SIGWINCH received BH— 


42 rows, 33 columns 


zi 
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终止 


18.13 termcap、terminfo 和 curses 


termcap 的 意思 是 终端 能 力 (terminal capability) ， 它 涉及 文本 文 
件 /etc/termcap 和 一 套 读 此 文件 的 例 程 。termcap 这 种 技术 是 在 伯克利 开 
发 的 ， 注 意 是 为 了 文 持 vi 编辑 器 。termcap 文 件 包 含 了 对 各 种 终端 的 说 
Hj. 终端 支持 哪些 功能 (如 行 数 、 列 数 、 终 端 是 否 支持 退 格 ) ， 如 何 
使 终端 执行 某 些 操作 (如 清 屏 、 将 光标 移动 到 给 定位 置 ) 。 把 这 些 信 
息 从 编译 过 的 程序 中 取出 来 并 把 它们 放 在 易于 编辑 的 文本 文件 中 ， 这 
样 吕 使 得 vi 编辑 圳 能 在 很 多 不 同 的 终端 上 运行 。 

最 后 ， 将 文 持 termcap 文 件 的 例 程 从 vi 编辑 右 中 抽取 出 来 ， 放 在 一 
个 单独 的 curses 库 中 。 为 使 这 套 库 可 供 要 进行 屏幕 处 理 的 任何 程序 使 
用 ， 还 增加 了 很 多 功能 。 

termcap 这 种 技术 并 不 是 很 完善 。 当 越 来 越 多 的 终端 被 加 到 数据 文 
件 中 时 ， 为 找到 一 个 特定 的 终端 ， 需 要 花费 更 长 的 时 间 扫 描 此 数据 文 
件 。 这 个 数据 文件 还 用 两 个 字符 的 名 字 来 标识 不 同 的 终端 属性 。 这 些 
缺陷 迫使 开发 人 员 开 发 出 了 terminfo 以 及 与 其 相关 的 curses 库 。 在 
terminfo 中 ， 终 端 说 明基 本 上 都 是 文本 说 明 的 编译 版 本 ， 在 运行 时 易于 
被 快速 定位 。terminfo 最 初 由 SVR2 开 始 使 用 ， 此 后 所 有 System V 的 版 
本 都 使 用 它 。 

历史 上 ， 基 于 System V 的 系统 使 用 terminfo，BSD 派 生 的 系统 使 用 
termcap， 但 是 现在 ， 系 统 通常 两 者 都 提供 。 然 而 Mac OS X 仅 文 持 


terminfo ° 


Goodheart[1991] 对 terminfo 和 curses 库 进行 了 详细 说 明 ， 但 此 书 已 不 
再 增 印 。Strang[1986] 说 明 T curses EN SUR AYA be AAS © Strang ` Mui 
和 O’”Reilly[1988] 则 对 termcap 和 terminfo 进 行 了 说 明 。 

可 在 http://invisible-island.net/ncurses/ncurses.html 或 http://www.gnu. 
org/software/ncurses 上 找到 与 SVR4 curses 接 口 兼 容 的 开放 版 ncurses 函 数 
库 o 

不 论 是 termcap 还 是 terminfo， 它 们 本 喘 都 不 处 理 本 章 所 述 及 的 问 

pal: 更 改 终端 的 模式 、 更 改 终端 特殊 字符 、 处 理 窗口 大 小 等 。 EMI 
提供 的 是 在 各 种 终端 上 执行 典型 操作 〈 清 屏 、 移 动 光 标 ) 的 方法 。 

一 方面 ， 在 本 章 所 述 问 题 方面 ，curses ND dpt DON 
助 。curses 提 供 了 很 多 函数 ， 用 来 设置 原始 模式 、 设 置 cbreak 模 式 、 打 
开 和 关闭 回 显 等 。 注 意 ，curses 库 是 为 基于 字符 的 哑 终 端 设 计 的 ， 而 如 
今 ， 它 们 大 部 分 已 被 以 基于 像素 的 图 形 终端 所 代 蔡 。 


18.14 小 结 


终端 有 很 多 特征 和 选项 ， 其 中 大 多 数 都 可 按 需 进行 更 改 。 本 章 描 
述 了 很 多 更 改 终端 操作 〈 即 更 改 特殊 输入 字符 和 可 选择 标志 ) A 
数 ， 还 介绍 了 可 对 终端 设备 进行 设置 或 恢复 的 各 个 终端 特殊 字符 以 及 
众多 选项 

终端 的 输入 模式 有 两 种 一 规范 的 〈 每 次 一 行 ) 和 非 规范 的 。 本 章 
中 包含 了 大 干 这 两 种 工作 模式 的 实例 ， 也 提供 了 一 些 函 数 ， 它 们 在 
POSIX.1 终 端 选 项 和 较 早 的 BSD cbreak 模 式 及 原始 模式 之 间 进 行 映 射 。 
本 章 还 说 明了 如 何 获取 和 改变 终端 窗口 大 小 。 


习题 


18.1 编写 一 个 调用 tty. raw 并 且 不 恢复 终端 模式 就 终止 的 程序 。 如 
果 系 统 提供 reset(1) 命 令 (本 书 说 明 的 4 种 平台 全 都 提供 ) ， 使 用 该 命令 
恢复 终端 模式 。 

18.2 c_cflag 字 上 段 的 PARODD 标 志 人 允许 我 们 设置 奇 检验 或 个 校 验 ， 
而 BSD 中 的 tip 程 序 也 允许 奇偶 校 验 位 为 0 或 1。 它 是 如 何 实现 的 ? 

18.3 如 果 你 系统 中 的 stty(1) 命 令 输出 MIN 和 TIME 值 ， 做 下 面 的 练 
习 。 登 录 系 统 两 次 ， 其 中 一 次 登录 时 打开 vi 编辑 器 ， 在 另外 一 次 登录 中 
用 stty 命 令 确定 vi 设置 的 MIN 和 TIME 值 (因为 vi 将 终端 设置 为 非 规范 模 
XX) 。 (如 果 你 的 终端 上 有 窗口 系统 正在 运行 ， 那 么 你 也 可 以 进行 同 
样 的 测试 ， 方 法 是 ， 登录 一 次 ， 然 后 用 两 个 分 开 的 窗口 。 ) 
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19.1 引言 


在 第 9 章 中 ， 我 们 了 解 到 ， 终 端 登录 是 经 由 自动 提供 终端 语义 的 终 
端 设备 进行 的 。 在 终端 和 运行 程序 之 间 有 一 个 终端 行规 程 〈 见 图 18- 
2) ， 通 过 该 规程 我 们 能 够 设置 终端 的 特殊 字符 (如 退 格 、 行 删除 、 中 
Wr) 。 但 是 ， 当 一 个 登录 请 求 到 达 网 络 连接 时 ， 终 端 行规 程 并 不 是 
自动 被 加 载 到 网 络 连 接 和 登录 shell 之 间 的 。 图 9-5 显 示 了 一 个 伪 终 端 
(pseudo terminal) 设备 驱动 程序 ， 用 于 提供 终端 语义 。 

伪 终 端 除 了 用 于 网 络 登 录 ， 还 有 其 他 用 途 ， 本 章 将 对 此 进行 介 
绍 。 首 先 概要 叙述 如 何 使 用 伪 终 端 ， 接 着 讨论 某 些 特殊 使 用 情况 。 然 
后 ， 提 供 在 多 种 平台 下 用 于 创建 伪 终 端的 函数 ， 并 使 用 这 些 画 数 编写 
一 个 程序 ， 我 们 将 该 程序 称 为 pty。 将 看 到 pty 程 序 的 各 种 用 途 : 抄录 在 
终端 上 输入 和 输出 的 所 有 字符 (script DOES). ;运行 协同 进程 来 避免 
图 15-19 中 的 程序 遇 到 的 缓冲 区 问题 。 


19.2 概述 


伪 终 端 这 个 术语 是 指 ， 对 于 一 个 应 用 程序 而 言 ， 它 看 上 去 像 一 个 
终端 ， 但 事实 上 它 并 不 是 一 个 真正 的 终端 。 图 19-1 显示 了 使 用 伪 终 端 


时 ， 相 关 进 程 的 典型 安排 。 图 中 的 关键 点 如 下 。 


图 19-1 使 用 伪 终 端的 相关 进程 的 典型 结构 

“ 通 解 ， 一 个 进程 打开 伪 终 端 主 设备 ， 然 后 调用 fork。 子 进程 建立 
一 个 新 的 会 话 ， 打 开 一 个 相应 的 伪 终 端 从 设备 ， 将 其 文件 描述 符 复 制 
到 标准 输入 、 标 准 输出 和 标准 和 错误， 然后 调用 exec。 伪 终端 从 设备 成 为 
子 进程 的 控制 终端 。 

“对 于 伪 终 端 从 设备 上 的 用 户 进程 来 说 ， 其 标准 输入 、 标 准 输出 和 
标准 错误 都 是 终端 设备 。 通 过 这 些 描述 符 ， 用 户 进程 能 够 处 理 第 18 3 


中 的 所 有 终端 VO 函数 。 但 是 因为 伪 终 端 从 设备 不 是 真正 的 终端 设备 ， 
所 以 无 意义 的 函数 调用 〈 例 如 ， 改 变 波 特 率 、 发 送 中 断 符 、 设 置 奇 偶 
校 验 ) 将 被 忽略 。 

“任何 写 到 伪 终 端 主 设备 的 都 会 作为 从 设备 的 输入 ， 反 之 亦 然 。 事 
实 上 ， 所 有 从 设备 端的 

输入 都 来 自 于 伪 终 端 主 设备 上 的 用 户 进 程 。 这 看 起 来 就 像 一 个 双 
向 管道 ， 但 从 设备 上 的 终端 行规 程 使 我 们 拥有 普通 管道 没有 的 其 他 处 
理 能 

图 19-1 显 示 了 FreeBSD、Mac OS X 或 Linux 系 统 中 的 伪 终 端 结构 。 
19.3 节 将 介绍 如 何 打 开 这 些 设备 。 

在 Solaris 中 ， 伪 终端 是 使 用 STREAMS 子 系统 构建 的 ( 见 14.4 
T) 。 图 19-2 详 细 描 述 了 Solaris 中 各 个 伪 终 端 STREAMS 模 块 的 安排 。 
虚线 框 中 的 两 个 STREAMS 模块 是 可 选 的 。pckt 和 ptem 模块 帮助 提供 
伪 终 端 特有 的 语义 。 另 外 两 个 模块 (Idterm 和 ttcompat) 提供 行规 程 处 
理 。19.3 市 将 展示 如 何 建立 这 些 STREAMS 模 块 的 安排 。 

现在 简化 以 上 图 示 ， 不 再 画 出 图 19-1 中 的 “ 读 画 数 和 写 函 数 ” 或 图 
19-2 中 的 “ 流 首 ”。 同 时 使 用 缩写 "PTY” 表 示 伪 终端 ， 并 将 图 19-2 中 所 有 
伪 终 端 从 设备 之 上 的 STREAMS 模块 合并 在 一 起 表示 为 “终端 行规 程 ” 
模块 ， 像 图 19-1 中 的 那样 。 


stderr 


, 


stdin, stdout 


ttcompat 
ISTREAMS 模块 


r 
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图 19-2 Solaris 中 的 伪 终 端 安排 

现在 ， 我 们 来 考察 伪 终 端的 某 些 典型 用 途 。 

1. 网 络 登录 服务 器 

伪 终 病 可 用 于 构造 提供 网 络 登 录 的 服务 絮 。 典 型 的 例子 是 telnetd 
和 rlogind 服务 器 。Stevens[1990] 中 的 第 15 章 详细 讨论 了 提供 rlogin 服 务 
的 步骤 。 一 旦 登录 shell 运 行 在 远 端 主机 上 ， 即 可 得 到 网 19-3 中 所 示 的 安 
排 。telnetd 服 务 器 使 用 类 似 的 安排 。 

在 rlogind 服 务 器 和 登录 shell 之 间 有 两 个 exec 调 用 ， 这 是 因为 login 程 
序 通常 是 在 两 个 exec 之 间 检 验 用 户 是 否 合法 © 

图 19-3 的 一 个 关键 点 是 ， 驱 动 PTY 主 设备 的 进程 通常 同时 在 读 写 男 
一 个 IO 流 。 本 例 中 另 一 个 IO 流 是 TCP/IP 框 。 这 表示 该 进程 必然 使 用 了 
某 种 形式 的 诸如 select 或 poll 这 样 的 1/O 多 路 转 接 〈 见 14.4 节 ) ， 或 者 被 
分 成 两 个 进程 或 线程 。 

2. 窗口 系统 终端 模拟 

窗口 系统 通常 提供 一 个 终端 模拟 器 ， 这 样 我 们 就 能 在 熟悉 的 命令 
行 环境 中 通过 shell 来 运行 程序 。 终 端 模拟 器 作为 shell 和 窗口 管理 器 之 
间 的 媒介 。 每 个 shell 在 自己 的 窗口 中 执行 。 这 个 安排 (两 个 shell 运 行 在 
不 同窗 口 ) 如 图 19-4 所 示 。 

shell 将 目 己 的 标准 和 输入、 标准 输出 、 标 准 错 误 和 连接 到 PTY 的 从 设备 
端 。 终 端 模 拟 器 程序 打开 PTY 的 主 设备 。 终 端 模拟 器 除了 作为 窗口 子 
系统 的 接口 ， 还 要 负责 模拟 一 种 特殊 的 终端 ， 这 意味 着 它 需要 根据 它 
所 模拟 的 设备 类 型 来 啊 应 返回 码 。 这 些 码 列 在 termcap 和 terminfo 数 据 库 
中 o 
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窗口 1 | 窗口 2 
终端 模拟 器 


stdout stdin 


stderr 
行规 程 
Y | 内 核 
PTY 从 设备 PTY 主 设备 PTY 主 设备 PTY 从 设备 


图 19-4 窗口 系统 的 进程 安排 

当 用 户 改 变 终 端 模 拟 器 窗口 的 大 小 时 ， 窗 口 管理 絮 会 通知 终端 模 
tas o 28 vig ETT as CE PT Y FJ Ei 9 A. ti TIOCSWINSZ ioctl 命 令 来 设 
置 从 设备 的 窗口 大 小 。 如 果 新 的 窗口 大 小 和 当前 的 不 同 ， 内 核 会 发 送 
一 个 SIGWINCH 信 号 给 前 台 PTY 从 设备 的 进程 组 。 如 果 应 用 程序 在 窗 
口 大 小 改变 时 需要 重 绘 屏 幕 ， 它 束 会 捕捉 这 个 SIGWINCH 信 和 号， 然后 
发 出 TIOCSWINSZ ioct 命 令 获 得 新 的 屏幕 尺寸 并 重 绘 屏 幕 。 

ds script 程 序 

script(1) 程 序 是 随 大 多 数 UNIX 系统 提供 的 ， 它 将 终端 会 话 期 间 的 
所 有 输入 和 输出 信息 复制 到 一 个 文件 中 。 为 完成 此 工作 ， 该 程序 将 自 
己 置 于 终端 和 一 个 新 调用 的 登录 shell 之 间 。 图 19-5 详 细 描 述 了 script 程 
序 有 关 的 交互 。 这 里 要 特别 指出 ，script 程 序 通 常 是 从 登录 shell 启 动 
的 ， 该 shell 还 要 等 得 script 程 序 的 终止 。 


脚本 文件 


script 进程 


登录 fork 


shell exec 


图 19-5 script 程 序 

script 程 序 运行 时 ， 位 于 PTY 从 设备 上 的 终端 行规 程 的 所 有 输出 都 
将 复制 到 脚本 文件 中 (通常 称 为 typescript) 。 因 为 击 键 通常 由 该 行规 
程 模 块 回 显 ， 所 以 该 脚本 文件 也 包括 了 输入 的 内 容 。 但 是 ， 因 为 键入 
的 口令 不 会 回 显 ， 所 以 该 脚本 文件 不 会 包含 口令 。 

在 编写 本 书 第 1 版 时 ，Rich Stevens 用 script 程 序 获 取 实 例 程序 的 输 
出 。 这 样 避免 了 手工 复制 程序 输出 可 能 带 来 的 错误 。 但 是 ， 使 用 script 
的 不 足 之 处 是 必须 处 理 脚 本 文件 中 的 控制 字符 。 

在 19.5 广 开发 了 通用 的 pty 程 序 后 ， 我 们 将 看 到 使 用 pty 程 序 和 一 个 
简单 的 shell 脚 本 就 能 够 实现 一 个 新 版 本 的 script 程 序 。 

4. expect 程 序 


伪 终 端 可 以 用 来 在 非 交 互 模式 中 驱动 交互 式 程序 的 运行 。 许 多 硬 
连 线 程序 需要 一 个 终端 才能 运行 ，passwd(1) 命 令 就 是 一 个 例子 ， 它 要 
求 用 户 在 系统 提示 后 输入 口令 。 

为 了 支持 批 处 理 操 作 模 式 而 修改 所 有 交互 式 程序 是 非常 矿 烦 的 ， 
与 这 种 处 理 相 比 ， 一 个 更 好 的 解决 方法 是 通过 一 个 脚本 来 驱动 交互 式 
程序 。expect 程 序 [Libes 1990, 1991, 1994] 提 供 了 这 样 的 方法 。 类 似 于 
19.5 节 的 pty 程 序 ， 它 使 用 伪 终 端 来 运行 其 他 程序 。 并 有 日 ，expect 还 提供 
了 一 种 编程 语言 用 于 检查 运行 程序 的 输出 ， 以 确定 用 什么 作为 输入 发 
送 给 该 程序 。 当 一 个 源 自 脚本 的 交互 式 的 程序 正在 运行 时 ， 不 能 仅仅 
是 将 脚本 中 的 所 有 内 容 复 制 到 程序 中 去 ， 或 者 将 程序 的 输出 送 至 脚 
本 ， 而 是 必须 要 回程 序 发 送 某 个 输入 ， 检 查 它 的 输出 ， 并 决定 下 一 步 
发 送 给 程序 的 内 容 。 

5. 运行 协同 进程 

在 图 15-19 所 示 的 协同 进程 的 例子 中 ， 我 们 不 能 调用 使 用 标准 IO 库 
进行 输入 、 输 出 的 协同 进程 ， 这 是 因为 当 通过 管道 与 协同 进程 进行 通 
信 时 ， 标 准 IO 库 会 完全 缓冲 标准 输入 和 标准 输出 ， 从 而 引起 死 锁 。 如 
果 协 同 进 程 是 一 个 已 经 编译 的 程序 而 我 们 又 没有 源 程 序 ， 则 无 法 在 源 
程序 中 加 入 fflush 语 句 来 解决 这 个 问题 。 图 15-16 显 示 了 一 个 进程 驱动 协 
同 进程 的 情况 。 我 们 需要 做 的 是 将 一 个 伪 终 端 放 到 两 个 进程 之 间 (如 
图 19-6 所 示 ) ， 诱 使 协同 进程 认为 它 是 由 终端 驱动 的 ， 而 非 另 一 个 进 
程 。 


协同 进程 


stdin 


驱动 程序 


stdout 


图 19-6 用 盆 终 端 驱动 一 个 协同 进程 


现在 协同 进程 的 标准 输入 和 标准 输出 残 像 终端 设备 一 样 ， 所 以 标 
准 IO 库 会 将 这 两 个 流 设置 成 行 缓冲 。 

父 进 程 有 两 种 方法 在 自身 和 协同 进程 之 间 获 得 伪 终 端 。 (这 种 情 
况 下 的 父 进程 可 以 类 似 图 15-18 中 的 程序 ， 使 用 两 个 管道 和 协同 进程 进 
行 通信 。) 一 个 方法 是 ， 父 进程 直接 调用 pty_fork 函 数 ( 见 19.4 节 ) 而 
不 是 调用 fork。 另 一 种 方法 是 ，exec 该 pty 程 序 (019.57) ， 将 协同 进 
程 作为 参数 。 我 们 将 在 给 出 pty 程 序 后 介绍 这 两 种 方法 。 

6. 观看 长 时 间 运 行程 序 的 输出 

使 用 任何 一 个 标准 shell， 可 以 将 一 个 需要 长 时 间 运 行 的 程序 放 到 
后 台 运 行 。 但 是 ， 如 果 将 该 程序 的 标准 输出 重 定向 到 一 个 文件 ， 并 且 
它 产 生 的 输出 又 不 多 ， 那 么 我 们 就 不 能 方便 地 监控 程序 的 进展 ， 因 为 
标准 IO 库 将 完全 绥 神 它 的 标准 和 输出。 我 们 看 到 的 将 只 是 标准 MO 库 函 数 
写 到 输出 文件 中 的 成 块 输出 ， 有 时 甚至 可 能 是 长 度 为 8 192 字 节 的 数据 
Ek o 

如 果 有 源 程 序 ， 则 可 以 加 入 fflush 调 用 强制 标准 IO 缓冲 区 在 某 些 节 
点 促 洗 或 者 把 绥 冲 模式 改 成 使 用 setvbuf 的 行 缓冲 。 然 而 ， 如 果 没 有 源 
程序 ， 可 以 在 pty 程 序 下 运行 该 程序 ， 让 标准 MO 库 认 为 标准 输出 是 终 
端 。 图 19-7 显 示 了 这 个 安排 ， 我 们 将 这 个 缓慢 输出 的 程序 称 为 
slowout。 从 登录 shell 到 pty 进 程 的 foryexec 箭 头 是 用 虚线 表示 的 ， 为 的 
是 强调 pty 进 程 是 作为 后 台 任 务 运 行 的 。 


stdout 
stderr 


图 19-7 使 用 伪 终 端 运行 一 个 缓慢 输出 的 程序 
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PTY 表 现 得 就 像 物 理 终 端 设 备 一 样 ， 因 此 应 用 程序 就 无 须 在 意 它 
们 在 使 用 的 是 何 种 设备 。 然 而 ， 在 打开 PTY 设 备 文件 时 ， 应 用 程序 并 
不 需要 设置 O_TTY_INIT 标 识 。Single UNIX Specification 已 经 要 求 PTY 


从 设备 端 第 一 次 被 打开 的 时 候 要 初始 化 ， 这 样 该 设备 正常 工作 所 需要 
的 所 有 非 标准 termios 标 识 丈 都 被 设置 了 。 这 个 要 求 旨 在 允许 PTY 设 备 
和 遵循 POSIX 的 调用 tcgetattr 和 tcsetattr 的 应 用 程序 正确 地 运行 。 

各 种 平台 打开 伪 终 端 设 备 的 方法 有 所 不 同 。 在 Single UNIX 
Specification 的 XSI 扩 展 中 包含 了 很 多 函数 ， 试 图 统一 这 些 方 法 。 这 些 
函数 的 基础 是 SVR4 用 于 管理 基于 STREAMS 的 伪 终 端的 一 组 函数 。 
posix openptÉN ži a Ht 了 一 种 可 移植 的 方法 来 打开 下 一 个 可 用 伪 终 端 主 
设备 。 

#include <stdlib.h> 


#include <fcntl.h> 


int posix_openpt(int oflag); 
返回 值 : 者 成 功 ， 返 回 下 一 个 可 用 的 PTY 主 设备 文件 描述 符 ; JEU 
错 ， 返 回 -1 

参数 oflag 是 一 个 位 屏蔽 字 ， 指 定 如 何 打开 主 设备 ， 它 类 似 于 
open(2) 的 oflag 参 数 ， 但 是 并 不 文 持 所 有 打开 标志 。 对 于 posix_openpt， 
可 以 指定 O_RDWR 来 打开 主 设备 进行 读 、 写 ， 指 定 O_NOCTTY 来 防止 
主 设备 成 为 调用 者 的 控制 终 靖 。 其 他 打开 标志 都 会 导致 未 定义 的 行 
为 。 

在 伪 终 端 从 设备 可 用 之 前 ， 它 的 权限 必须 设置 ， 以 便 应 用 程序 可 
以 访问 它 。grantpt 汞 数 提 供 这 样 的 功能 ， 它 把 从 设备 广 点 的 用 户 D 设 
置 为 调用 者 的 实际 用 户 ID， 设 置 其 组 ID 为 一 非 指定 值 ， 通 常 是 可 以 访 
问 该 终端 设备 的 组 。 权 限 被 设置 为 : 对 个 体 所 有 者 是 读 / 写 ， 对 组 所 有 
者 是 写 (0620) 。 

实现 通常 将 PTY 从 设备 的 组 所 有 者 设置 为 ty 组 。 把 那些 要 对 系统 
中 所 有 活动 终端 具有 写 权 限 的 程序 (如 wall(1) 和 write(1)) 的 设置 组 ID 
设置 为 ty 组 。 因 为 在 PTY 从 设备 上 tty 组 的 写 权 限 是 被 允许 的 ， 所 以 这 
些 程序 就 可 以 向 活动 终端 写 入 。 


#include <stdlib.h> 

int grantpt(int fd); 

int unlockpt(int fd); 

两 个 函数 的 返回 值 : AH, GRIGIO; rita, x1 

为 了 更 改 从 设备 节点 的 权限 ，grantpt 可 能 需要 fork 并 exec 一 个 设置 
用 户 ID 程 序 (如 在 Solaris 中 是 /usr/lib/pt_chmod) 。 于 是 ， 如 果 调 用 者 
捕捉 到 SIGCHLD 信和 号， 那么 其 行为 是 未 说 明 的 。 

unlockpt 函数 用 于 准予 对 伪 终 端 从 设备 的 访问 ， 从 而 允许 应 用 程序 
打开 该 设备 。 阻 止 其 他 进程 打开 从 设备 后 ， 建 立 该 设备 的 应 用 程序 有 
机 会 在 使 用 主 、 从 设备 之 前 正确 地 初始 化 这 些 设 备 。 

注意 ， 在 grantpt 和 unlockpt 这 两 个 函数 中 ， 文 件 描述 符 参 数 是 与 伪 
终端 主 设备 关联 的 文件 描述 符 。 

如 有 宁 给 定 了 伪 终 端 主 设备 的 文件 描述 符 ， 那 么 可 以 用 ptsname 函数 
找到 伪 终 端 从 设备 的 路 径 名 。 这 使 应 用 程序 可 以 独立 于 给 定 平台 的 某 
种 特定 约定 而 标识 从 设备 。 注 意 ， 该 男 数 返回 的 名 字 可 能 存储 在 静态 
存储 中 ， 因 此 后 续 的 调用 可 能 会 履 兰 它 。 

#include <stdlib.h> 

char *ptsname(int fd); 
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grantpt 更 改 PTY 从 设备 的 权限 


posix openpt | 打开 一 个 PTY 主 设备 
ptsname 返回 PTY 从 设备 的 名 字 
unlockpt 允许 打开 PTY 从 设备 
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在 FreeBSD 中 ，grantpt 和 unlockpt 除 了 参数 验证 外 不 执行 任何 操 
作 ，PTY 是 通过 正确 的 权限 动态 地 创建 出 来 的 。 注 意 ，FreeBSD 定 义 
O_NOCTTY 标 志 只 是 为 了 兼容 调用 posix_openpt 的 应 用 程序 。 在 
FreeBSD 中 打开 终端 设备 并 不 会 引起 分 配 控制 终端 的 副作用 ， 所 以 
O_NOCTTY 标 志 并 无 作用 ° 

Single UNIX Specification 已 经 改善 了 此 方面 的 可 移植 性 ， 但 是 差距 
仍然 存在 。 我 们 提供 了 两 个 处 理 所 有 这 些 细 市 的 落 数 : ptym_open 和 
ptys_open。ptym_open 打 开 下 一 个 可 用 的 PTY 主 设备 ，ptys_open 打 开 相 
应 的 从 设备 。 


#include "apue.h" 


int ptym_open(char *pts name, int pts namesz); 

返回 值 : A, PTY RAM Ty, dini. e- 
int ptys_open(char *pts_name); 

返回 值 ， 若 成 功 ， 返 回 PTY 从 设备 文件 描述 符 ， 若 出 错 ， "d 

通常 ， 不 直接 调用 这 两 个 函数 ， 而 是 由 函数 pty fork (J 19. 
节 ) 调用 它们 ， 并 且 还 会 fork 出 一 个 子 进程 。 

ptym_open 夯 数 打 开 下 一 个 可 用 的 PTY 主 设备 。 调 用 者 必须 分 配 一 
个 数组 来 存放 主 设备 或 从 设备 的 名 字 ， 并 且 如 果 调 用 成 功 ， 相 应 的 从 
设备 名 会 通过 pts_name 返 回 。 然 后 ， 这 个 名 字 传 给 用 来 打开 该 从 设备 的 
ptys_open 范 数 。 绥 冲 区 的 字 节 长 度 由 pts_namesz 传 送 ， 使 得 ptym_open 
函数 不 会 复制 比 该 缓冲 区 长 的 字符 串 。 
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将 会 很 明显 。 ， 一 个 进程 调用 ptym_open 来 打开 一 个 主 设备 并 且 得 
到 从 设备 名 。 REPE d 子 进程 在 调用 setsid 建 立新 的 会 
话 后 调用 ptys_open 打 开 从 设备 。 这 职 是 从 设备 如 何 成 为 子 进程 控制 终 
端的 过 程 〈 见 图 19-9) 。 


#include "apue.h" 
#include <errno.h> 
#include <fcntl.h> 
#if defined (SOLARIS) 
#include <stropts.h> 
#endif 


int 
ptym open(char *pts name, int pts namesz) 
{ 

char toT 

int fdm, err; 


if ((fdm = posix openpt(O RDWR)) < 0) 
return(-1); 

if (grantpt(fdm) < 0) /* grant access to slave */ 
goto errout; 


if (unlockpt(fdm) « 0) /* clear slave's lock flag */ 


goto errout; 
if ((ptr = ptsname(fdm)) == NULL) /* get slave's name */ 
goto errout; 


/* 
* Return name of slave. Null terminate to handle 
* case where strlen(ptr) » pts namesz. 


“7 
strncpy(pts name, ptr, pts namesz); 
pts name[pts namesz - 1] = '\O'; 
return(fdm); /* return fd of master */ 
errout: 


err = errno; 
close (fdm); 
errno = err; 
return (-1); 


int 
ptys_open(char *pts_name) 
{ 

Int Edar 
#if defined(SOLARIS) 

int err, setup; 
#endif 


if ((fds = open(pts_name, O_RDWR)) < 0) 
return (-1); 


#if defined(SOLARIS) 
/* 
* Check if stream is already set up by autopush facility. 
m 
if ((setup = ioctl(fds, I FIND, "ldterm")) « 0) 
goto errout; 


if (setup == 0) ( 

if (ioctl(fds, I PUSH, "ptem") « 0) 
goto errout; 

if (d3octl(fds, T PUSH, "idtermn") < 0) 
goto errout; 

it (Xocutb(ofds, IJPUSH, "ttcompatr") x 0) t 

errout: 

err = errno; 


图 19-9 伪 终 端 打开 函数 


ptym openEX 24 Hl XSI PTY 函数 找到 并 打开 一 个 未 被 使 用 的 PTY 主 
设备 ， 并 初始 化 对 应 的 PTY 从 设备 。ptys_open 函 数 打 开 的 是 PTY 从 设 
备 。 然 而 在 Solaris 系 统 中 ， 在 PTY 从 设备 表现 得 像 个 终端 前 ， 我 们 可 能 
需要 多 做 几 步 工作 。 

在 Solaris 中 ， 打 开 从 设备 后 ， 我 们 可 能 需要 将 3 个 STREAMS 模 块 
压 入 从 设备 的 流 中 。 伪 终端 仿真 模块 (ptem) 和 终端 行规 程 模块 

(ldterm) 合 在 一 起 像 一 个 真正 的 终端 一 样 工 作 。ttcompat 提 供 了 对 早 
期 系统 (如 V7、4BSD 和 Xenix) 的 iocd 调 用 的 兼容 性 。 这 是 一 个 可 选 
的 模块 ， 但 是 因为 对 于 网 络 登 录 ， 它 是 自动 压 入 的 ， 所 以 我 们 将 它 压 
入 到 从 设备 的 流 中 。 

也 可 能 并 不 需要 压 入 这 3 个 模块 ， 其 原因 是 ， 它 们 可 能 已 经 位 于 流 
中 。STREAMS 系 统 支 持 一 种 称 为 autopush (自动 压 入 ) WIR, ER 
许 系统 管理 员 配 置 一 张 模块 列表 ， 只 要 打开 一 个 特定 设备 ， 束 将 这 些 
模块 压 入 流 中 〈 详 见 Rago[1993]) 。 使 用 I_FIND ioctl 命 令 观 察 ldterm 是 
否 已 在 流 中 。 如 果 是 ， 则 认为 该 流 已 用 autopush 机 制 配 置 ， 这 样 就 无 需 
再 压 入 相应 模块 。 

Linux ` Mac OS X 和 Solaris 都 遵循 历史 上 System V 的 行为 : 如 果 调 
用 者 是 一 个 还 没有 控制 终端 的 会 话 首 进程 ， 这 个 打开 (open) 的 调用 
会 分 配 一 个 PTY 从 设备 作为 控制 终端 。 如 果 不 想 让 这 种 情况 发 生 ， 可 
以 在 打开 (open) 时 设置 O0 NOCTTY 标 志 。 然 而 ， 在 FreeBSD 中 ， 打 


开 PTY 从 设备 不 会 产生 分 配 其 作为 控制 终端 的 副作用 ， 下 一 节 将 探讨 
如 何在 FreeBSD 中 分 配 控制 终端 。 


19.4 函数 pty_fork 


MEEK E— ZR A TS ENZXptym. open 和 ptys_open 来 编写 一 个 
新 函数 ， 我 们 称 之 为 pty_fork。 这 个 新 函数 具有 如 下 功能 : 用 fork 调 用 
打开 主 设备 和 从 设备 ， 创 建 作为 会 话 首 进程 的 子 进程 并 使 其 具有 控制 
终端 。 
#include "apue.h" 
#include <termios.h> 
pid_t pty_fork(int *ptrfdm, char *slave_name, int slave_namesz, 
const struct termios *slave_termios, 
const struct winsize *slave_winsize); 
返回 值 ， 子 进程 中 返回 90， 父 进程 中 返回 子 进程 的 进程 ID; ate, ik 
回 -1 
PTY 主 设备 的 文件 描述 符 通 过 ptrfdm 指 针 返 回 。 
如 采 slave_name 不 为 空 ， 从 设备 名 被 存储 在 该 指针 指 同 的 存储 区 
中 。 调 用 者 必须 为 该 存储 区 分 配 空间 。 
如 宁 指 针 slave_termios 不 为 空 ， 则 系统 使 用 该 指针 所 引用 的 结构 初 
台 化 从 设备 的 终端 行规 程 。 如 有 果 该 指针 为 空 ， 那 么 系统 将 会 把 从 设备 
的 termios 结 构 设 置 成 实现 定义 的 初始 状态 。 类 似 地 ， 如 果 slave_winsize 
指针 不 为 空 ， 那 么 按 该 指针 所 引用 的 结构 初始 化 从 设备 的 窗口 大 小 。 
如 果 该 指针 为 空 ，winsize 结 构 通常 被 初始 化 为 0。 
图 19-10 显示 了 该 函数 的 代码 。 它 调用 相应 的 ptym_open 和 
ptys_open 函 数 ， 在 本 书 讨论 的 4 种 平台 上 ，pty_fork 碎 数 都 能 工作 。 


finclude "apue.h" 
#include <termios.h> 


pid t 

pty fork(int *ptrfdm, char *slave name, int slave namesz, 
const struct termios *slave termios, 
const struct winsize *slave winsize) 


int fdm, fds; 
pid t pid; 
char pts name[20]; 


if ((fdm = ptym open(pts name, sizeof(pts name))) « 0) 
err sys("can't open master pty: $s, error $d", pts name, fdm); 


if (slave name !- NULL) { 
/* 
* Return name of slave. Null terminate to handle case 
* where strlen(pts name) » slave namesz. 


*/ 
strncpy(slave name, pts name, slave namesz); 
Slave name[slave namesz - 1] = '\0'; 


if ((pid = fork()) < 0) { 
return(-1); 
} else if (pid == 0) { /* child */ 
if (setsid() < 0) 
err sys("setsid error"); 


/* 
* System V acquires controlling terminal on open(). 
*/ 
if ((fds = ptys_open(pts_name)) < 0) 
err sys("can't open slave pty"); 
close(fdm); /* all done with master in child */ 


#if defined(BSD) 
/* 
* TIOCSCTTY is the BSD way to acquire a controlling terminal. 
ui 
if (ioctl(fds, TIOCSCTTY, (char *)0) « 0) 
err sSys("TIOCSCTTY error"); 


#fendif 
/* 
* Set slave's termios and window size. 
x 
if (slave termios != NULL) ( 


if (tcsetattr(fds, TCSANOW, slave termios) < 0) 


err sys("tcsetattr error on slave pty"); 
} 
if (slave_winsize != NULL) { 
if (ioctl(fds, TIOCSWINSZ, slave_winsize) < 0) 
err_sys("TIOCSWINSZ error on slave pty"); 
} 


/* 
* Slave becomes stdin/stdout/stderr of child. 
x 
if (dup2(fds, STDIN FILENO) !- STDIN FILENO) 
err sys("dup2 error to stdin"); 
if (dup2(fds, STDOUT FILENO) !- STDOUT FILENO) 
err sys("dup2 error to stdout"); 
if (dup2(fds, STDERR FILENO) != STDERR FILENO) 
err sys("dup2 error to stderr"); 
if (fds != STDIN FILENO && fds != STDOUT FILENO && 
fds != STDERR FILENO) 
close(fds); 
return(0); /* child returns 0 just like fork() */ 
) else ( /* parent */ 
*ptrfdm - fdm; /* return fd of master */ 
return (pid); /* parent returns pid of child */ 


图 19-10 pty. forkER Zi 


在 打开 PTY 主 设备 后 ， 调 用 fork。 正 如 前 面 提 到 的 ， 子 进程 先 调用 
setsid 建 立新 的 会 话 ， 然 后 才 调 用 ptys_open。 当 调用 setsid 时 ， 子 进程 还 
不 是 一 个 进程 组 的 首 进 程 ， 因 此 执行 9.5 忆 中 列 出 的 3 个 操作 步骤 : 

(a) 子 进 程 创建 一 个 新 的 会 话 ， 它 是 该 会 话 的 首 进 程 ; (b) 子 进程 
创建 一 个 新 的 进程 组 ， (0) 子 进程 断 开 与 以 前 可 能 有 的 控制 终端 的 关 
联 ， 于 是 不 再 有 控制 终端 。 在 Linux、Mac OS X 和 Solaris 系 统 中 ， 当 调 
用 ptys_open 时 ， 从 设备 成 为 新 会 话 的 控制 终端 。 在 FreeBSD 系 统 中 ， 必 
须 调 用 TIOCSCTTY ioctl 来 分 配 一 个 控制 终端 (回想 图 9-8， 其 他 3 个 
平台 也 文 持 TIOCSCTTY ioctl 命 令 ， 但 是 只 有 在 FreeBSD 中 需要 我 们 去 
调用 它 。) 

termios 和 winsize 这 两 个 结构 在 子 进程 中 初始 化 。 最 后 从 设备 的 文 
件 描 述 符 被 复制 到 子 进 程 的 标准 输入 、 标 准 输出 和 标准 错误 中 。 这 意 


味 着 不 管子 进程 以 后 调用 exec 执 行 何 种 程序 ， 它 都 具有 同 PTY 从 设备 
(其 控制 终端 ) 联系 起 来 的 上 述 3 个 描述 符 。 

在 调用 fork 后 ， 父 进程 返回 PTY 主 设备 的 描述 符 以 及 和子 进 程 的 进程 
ID。 下 一 节 将 在 pty 程 序 中 使 用 pty_fork 函 数 。 


19.5 pty 程 序 
编写 pty 程 序 的 目的 是 用 
pty prog arg1 arg2 
AE 


prog arg1 arg2 

当 用 pty 来 执行 另 一 个 程序 时 ， 那 个 程序 在 一 个 它 目 己 的 会 话 中 执 
行 ， 并 和 一 个 伪 终 端 连接 。 

让 我 们 查看 pty 程 序 的 源 代码 。 第 一 个 文件 ( 见 图 19-11) main 
洲 数 。 它 调用 上 一 市 的 pty_fork 了 两 数 。 


#include "apue.h" 
#include <termios.h> 


#ifdef LINUX 
#define OPTSTR "+d:einv" 


#else 

#define OPTSTR "d:einv" 

fendif 

Static void set noecho(int); ie 
void do_driver(char *); Vis 
void loop(int, int); fR 
int 


main(int argc, char *argv[]) 


{ 


at the end of this file */ 
in the file driver.c */ 
in the file loop.c */ 


int fdm, c, ignoreeof, interactive, noecho, verbose; 
pid t pid; 
char *driver; 
char slave name[20]; 
struct termios orig termios; 
struct winsize size; 
interactive - isatty(STDIN FILENO); 
ignoreeof - 0; 
noecho = 0; 
verbose = 0; 
driver = NULL; 
opterr = 0; /* don't want getopt() writing to stderr */ 
while ((c = getopt(argc, argv, OPTSTR)) != EOF) { 
switch (c) { 
case 'd': /* driver for stdin/stdout */ 
driver - optarg; 
break; 
case 'e': /* noecho for slave pty's line discipline */ 
noecho = 1; 
break; 
case 'i': /* ignore EOF on standard input */ 


ignoreeof = 1; 


break; 

case 'n': /* not interactive */ 
interactive = 0; 
break; 

case 'y': /* verbose */ 


verbose = 1; 


break; 


case '?': 
err quit("unrecognized option: -$c", optopt); 


) 
if (optind »- argc) 
err quit("usage: pty [ -d driver -einv ] program [ arg ... ]"); 


if (interactive) ( /* fetch current termios and window size */ 
if (tcgetattr(STDIN FILENO, &orig termios) « 0) 
err sys("tcgetattr error on stdin"); 
if (ioctl(STDIN FILENO, TIOCGWINSZ, (char *) &size) « 0) 
err Sys("TIOCGWINSZ error"); 
pid = pty fork(&fdm, slave name, sizeof(slave name), 
&orig termios, &size); 
) else { 
pid = pty fork(&fdm, slave name, sizeof(slave_name), 
NULL, NULL); 


if (pid < 0) { 
err_sys (“fork error"); 
} else if (pid == 0) { /* child */ 
if (noecho) 
set_noecho(STDIN_FILENO); /* stdin is slave pty */ 


if (execvp(argv[optind], &argv[optind]) < 0) 
err sys("can't execute: $s", argv[optind]); 


if (verbose) { 
fprintf(stderr, "slave name = %s\n", slave name); 
if (driver != NULL) 
fprintf(stderr, "driver = %s\n", driver); 


if (interactive && driver == NULL) { 
if (tty_raw(STDIN_FILENO) < 0) /* user's tty to raw mode */ 
err sys("tty raw error"); 
if (atexit(tty atexit) < 0) /* reset user's tty on exit */ 
err sys("atexit error"); 


if (driver) 


do driver (driver); /* changes our stdin/stdout */ 
loop(fdm, ignoreeof); /* copies stdin => ptym, ptym -> stdout */ 
exit(0); 


static void 
set noecho(int fd) /* turn off echo (for slave pty) */ 
{ 


struct termios stermios; 


if (tcgetattr(fd, &stermios) « 0) 
err sys("tcgetattr error"); 


Stermios.c lflag &= ~(ECHO | ECHOE | ECHOK | ECHONL); 
/* 

* Also turn off NL to CR/NL mapping on output. 

wy 


stermios.c oflag &= -(ONLCR); 


if 


tcsetattr(fd, TCSANOW, &stermios) < 0) 


err_sys("tcsetattr error"); 


图 19-11 pty 程 序 的 main 函 数 

下 一 市 介绍 pty 程 序 的 不 同 用 途 时 ， 将 看 到 多 种 命令 行 选项 。getopt 
函数 帮助 我 们 以 协调 一 致 的 模式 分 析 命 令 行 参数 。 为 了 在 Linux 系 统 中 
强制 POSIX 行 为 ， 我 们 将 选项 字符 串 的 第 一 个 字符 设置 为 加 号 。 

在 调用 pty_fork 前 ， 我 们 获取 termios 和 winsize 结 构 的 当前 值 ， 将 其 
作为 参数 传递 给 pty_fork。 通 过 这 种 方法 ，PTY 从 设备 具有 和 当前 终端 
相同 的 初始 状态 。 

子 进 程 从 pty_fork 返 回 后 ， 可 选 地 关闭 了 PTY 从 设备 的 回 显 ， 然 后 
调用 execvp 来 执行 命令 行 指定 的 程序 。 所 有 余下 的 命令 行 参数 将 成 为 该 
程序 的 参数 。 

父 进程 可 选 地 将 用 户 终端 设置 为 原始 模式 。 在 这 种 情况 下 ， 父 进 
程 还 要 设置 退出 处 理 程序 ， 使 得 在 调用 exit 时 复原 终端 状态 。 下 一 节 ; 
摘 述 do_driver 函 数 ° 

接 下 来 ， 父 进程 调用 函数 loop 〈 见 图 19-12) ， 该 函数 仅仅 是 将 从 
标准 输入 接收 到 的 所 有 内 容 复制 到 PTY 主 设备 ， 并 将 PTY 主 设备 接收 到 
的 所 有 内 容 复制 到 标准 输出 。 尽 管 使 用 select 或 poll 的 单 进程 或 多 线程 是 
可 行 的 ， 但 是 为 了 有 所 变化 ， 这 里 使 用 了 两 个 进程 。 


#include "apue.h" 
#define BUFFSIZE 512 


static void sig_term(int); 
static volatile sig_atomic_t sigcaught; /* set by signal handler */ 


void 
loop(int ptym, int ignoreeof) 
{ 

pid_t child; 

int nread; 

char buf [BUFFSIZE]; 


if ((child = fork()) < 0) { 
err_sys("fork error"); 
) else if (child == 0) ( /* child copies stdin to ptym */ 
for Ge 293 t 
if ((nread = read(STDIN FILENO, buf, BUFFSIZE)) < 0) 
err sys("read error from stdin"); 
else if (nread == 0) 


break; /* EOF on stdin means we're done */ 
if (writen(ptym, buf, nread) != nread) 
err sys("writen error to master pty"); 


/* 
* We always terminate when we encounter an EOF on stdin, 
* put we notify the parent only if ignoreeof is O0. 
a 
if (ignoreeof == 0) 
kill(getppid(), SIGTERM); /* notify parent */ 
exit(0); /* and terminate; child can't return */ 


/* 
* Parent copies ptym to stdout. 

ay 
if (signal intr(SIGTERM, sig term) == SIG ERR) 


err sys("signal intr error for SIGTERM"); 


for (ge) 1 
if ((nread = read(ptym, buf, BUFFSIZE)) <= 0) 
break; /* signal caught, error, or EOF */ 
if (writen(STDOUT FILENO, buf, nread) != nread) 
err sys("writen error to stdout"); 


* There are three ways to get here: sig term() below caught the 
* SIGTERM from the child, we read an EOF on the pty master (which 
* means we have to signal the child to stop), or an error. 
*/ 
if (sigcaught == 0) /* tell child if it didn't send us the signal */ 
kill(child, SIGTERM); 


/* 
* Parent returns to caller. 
F. 


/* 

* The child sends us SIGTERM when it gets EOF on the pty slave or 
* when read() fails. We probably interrupted the read() of ptym. 
v 

static void 

sig term(int signo) 

{ 

sigcaught = 1; /* just set flag and return */ 


[19-12 loop ži 


注意 ， 因为 使 用 了 两 个 进程 所 以 一 个 终止 时 ， 必 须 通 知 另 一 
个 。 我 们 用 SIGTERM 信和 号 进行 这 种 通知 。 


19.6 使 用 pty 程 序 


接 下 来 看 几 个 pty 程 序 的 应 用 实例 ， 并 了 解 使 用 不 同 命令 行 选项 的 
必要 性 。 

如 果 使 用 Korn shell， 那 么 我 们 执行 命令 

pty ksh 

会 得 到 一 个 运行 在 伪 终 端 下 的 全 新 shell ° 

如 果 文 件 ttyname 包 含 了 图 18-16 中 所 示 的 程序 ， 那 么 可 按 如 下 模式 
执行 pty 程 序 : 

$ who 

sar console May 19 16:47 

sar ttys000 May 19 16:47 

sar ttys001 May 19 16:48 

sar ttys002 May 19 16:48 

sar ttys003 May 19 16:49 


sar ttys004 May 19 16:49 ttys004 是 当前 使 用 的 最 高 PTY 设 备 
$ pty ttyname 在 PTY 上 运行 图 18-16 中 的 程序 
fd 0: /dev/ttys005 ttys005 是 下 一 个 可 用 的 PTY 


fd 1: /dev/ttys005 

fd 2: /dev/ttys005 

1. utmp X 4f 

6.8 节 讨论 过 记录 当前 登录 到 UNIX 系 统 的 用 户 的 utmp 文 件 。 那 么 在 
伪 终 端 上 运行 程序 的 用 户 是 否 被 认为 是 登录 了 呢 ? 如 果 是 用 telnetd 和 


rlogind 远 程 登 录 ， 显 然 在 伪 终 端 上 登录 的 用 户 应 该 在 utmp 文 件 中 有 相 
应 记录 项 。 但 是 ， 通 过 窗口 系统 或 script 类 程序 在 伪 终 端 上 运行 shell 的 
用 户 是 否 应 该 在 utmp 文 件 中 有 相应 记录 项 呢 ? 有 的 系统 有 记录 ， 有 的 
没有 。 如 果 在 utmp 文 件 中 没有 记录 的 话 ，who(1) 程 序 一 般 不 会 显示 相 
应 伪 终 端正 在 被 使 用 。 

除非 utmp 文 件 允 许 其 他 用 户 的 写 权 限 (这 被 认为 是 一 个 安全 漏 
洞 ; ， 否 则 一般 使 用 伪 终 端的 程序 将 不 能 对 utmp 文 件 进行 写 操作 。 

2. 作业 控制 交互 

当 在 pty 下 运行 作业 控制 shell 时 ， 它 能 够 正常 地 运行 。 例 如 ， 

pty ksh 

将 在 pty 下 运行 Korn shell。 我 们 能 够 在 这 个 新 shell 下 运行 程序 并 使 
用 作业 控制 ， 这 如 同 在 登录 shell 中 一 样 。 但 如 末 在 pty 下 运行 一 个 交互 
式 程序 而 不 是 作业 控制 shell， 例 如 ， 

pty cat 

那么 在 键入 作业 控制 挂 起 字符 之 前 该 程序 的 运行 一 切 正 常 。 而 在 
键入 作业 控制 挂 起 字符 时 ， 作 业 控 制 挂 起 字符 将 会 被 显示 为 AZ， 并 且 
被 忽略 。 在 早期 基于 BSD 的 系统 中 ，cat 进程 终止 ，pty 进 程 终 止 ， 回 
到 初始 登录 shell。 为 了 明白 其 中 的 原因 ， 我 们 需要 检查 所 有 相关 的 进 
程 以 及 这 些 进程 所 属 的 进程 组 和 会 话 。 图 19-13 显 示 了 pty cat 运 行 时 的 
安排 。 

键入 挂 起 字符 (CuleZ) 时 ， 它 被 cat 进 程 下 的 行规 程 模 块 所 识 
别 ， 这 是 因为 pty 将 终端 (在 pty 父 进程 之 下 ) 设置 为 原始 模式 。 但 内 核 

` 会 停止 cat 进 程 ， 这 是 因为 它 属于 一 个 孤儿 进程 组 ( 见 9.10 节 ) ° cat 

的 父 进程 是 pty 父 进程 ， 它 属于 另 一 个 会 话 。 


un 
—1 
oO 总 


PTY 从 设备 


图 19-13 pty cat 的 进程 组 和 会 话 

历史 上 ， 不 同 的 系统 处 理 这 种 情况 的 方法 也 不 同 。POSIX.1 只 是 
说 明 SIGTSTP 信和 号 不 能 被 发 送 给 进程 。4.3BSD 的 派生 系统 向 进程 递 
送 一 个 它 从 不 捕获 的 SIGKILL 信号 。4.4BSD 没 有 采用 发 送 SIGKILL 信 
号 的 方法 ， 转 而 采用 符合 于 POSIX.1 的 处 理 方法 。 如 果 SIGTSTP 信 和 号 具 
有 默认 配置 ， 并 且 传 递 给 孤儿 进程 组 中 的 一 个 进程 ， 那 么 4.4BSD 的 内 
核 会 无 声明 地 丢弃 SIGTSTP 信 号 。 大 多 数 当 前 的 实现 都 采用 这 种 处 理 
模式 。 

当 我 们 使 用 pty 来 运行 作业 控制 shell 时 ， 被 这 个 新 shell 调 用 的 作业 
决 不 会 是 任何 孤儿 进程 组 的 成 员 ， 这 是 因为 作业 控制 shell 总 是 属于 同 
一 个 会 话 。 在 这 种 情况 下 ， 键 入 的 Ctrl+Z 被 发 送 到 由 shell 调 用 的 进程 ， 
而 不 是 shell 本 身 。 


让 上 pty 调用 的 进程 能 够 处 理 作业 控制 信号 的 唯一 的 方法 是 : a 
加 一 个 pty 命 令 行 标志 ， 使 pty 子 进程 自己 能 够 识别 作业 挂 起 字符 (在 pty 
子 进程 中 ) ， 而 不 是 让 该 字符 穿越 所 有 路 程 而 到 达 另 一 个 行规 程 模 
块 。 

3. 检查 长 时 间 运 行程 序 的 输出 

男 一 个 使 用 pty 进 行 作业 控制 交互 的 实例 见 图 19-7。 如 有 果 运 行 一 个 
绥 慢 产生 输出 的 程序 : 

pty slowout > file.out & 

当 子 进程 试图 从 标准 输入 (终端 读 入 数据 时 ，pty 进 程 立刻 停止 
运行 。 这 是 因为 该 作业 是 一 个 后 侣 作业 ， 并 且 当 它 试图 访问 终端 时 会 
使 作业 控制 停止 。 如 果 将 标准 输入 重 定 向 使 得 pty 不 从 终端 读 取 数据 ， 
如 : 

pty slowout < /dev/null > file.out & 

那么 pty 程 序 也 立即 停止 ， 因 为 它 从 标准 输入 和 终端 读 取 到 一 个 文 
件 结束 从 。 解 决 这 个 问题 的 方法 是 使 用 -ji 选项 ， 这 个 选项 的 含义 是 忽略 
来 自 标 准 输入 的 文件 结束 符 : 

pty -i slowout < /dev/null > file.out & 

这 个 标志 导致 在 遇 到 文件 结束 符 时 ， 图 19-13 的 pty 子 进程 退出 ， 但 
子 进程 不 会 告诉 父 进程 终止 。 相 反 ， 父 进程 一 直 将 PTY 从 设备 的 输出 
复制 到 标准 输出 (本 例 中 是 文件 fe.out) 

4. script 程 序 

使 用 pty 程 序 可 以 把 script(1) 程 序 实现 成 下 面 shell 脚 本 : 

#!/bin/sh 

pty "${SHELL:-/bin/sh}" | tee typescript 

一 旦 执行 这 个 shell 脚 本 ， 即 可 执行 ps 命令 来 观察 进程 之 间 的 天 系 。 
图 19-14 详 细 地 显示 了 这 些 关 系 。 


typescript 


登录 — sh 
shell 


119-14 script shell 脚 本 的 进程 安排 


管道 


在 这 个 例子 中 ， 假 设 SHELL 变 量 是 Korn shell (可 能 是 /bin/ksh) 
如 前 面 所 述 ，script 仅 仅 是 将 新 的 shell (和 它 调 用 的 所 有 的 子 进程 ) 的 
输出 复制 出 来 ， 但 是 因为 PTY 从 设备 上 的 行规 程 模 块 通常 允许 回 显 ， 
所 以 绝 大 多 数 键 入 也 都 被 写 到 typescript 文 件 中 。 

5. 运行 协同 进程 

在 图 15-8 所 示 的 程序 中 ， 协 同 进程 不 能 使 用 标准 WO 函数 ， 其 原因 
苹 标 准 输入 和 标准 输出 不 是 终端 ， 所 以 标准 W/O 函数 会 将 它们 放 到 缓 促 
区 中 。 如 果 把 

if (execl("./add2", "add2", (char *)0) < 0) 

替换 成 

if (execl(" /pty", "pty", "-e", "add2", (char *)0) < 0) 

在 pty 下 运行 协同 进程 ， 该 程序 即使 使 用 了 标准 WO 仍然 可 以 正确 运 


图 19-15 显 示 了 在 使 用 伪 终 端 作为 协同 进程 的 输入 和 输出 时 ， 进 程 
的 安排 。 这 是 图 19-6 的 扩充 ， 它 显示 了 所 有 的 进程 连接 和 数据 流 。 框 中 
的 “驱动 程序 ”是 按 前 面 的 说 明 更 改 了 execl 的 图 15-8 的 程序 。 

这 一 实例 显示 了 -e (不 回 显 ) 选项 对 于 pty 程 序 的 重要 性 。 因 为 pty 
程序 的 标准 输入 没有 连接 到 终端 ， 所 以 它 不 以 交互 方式 运行 。 在 图 19- 
11 程序 中 ，interactive 标志 默认 为 假 ， 这 是 因为 对 isatty 调 用 的 返回 是 
假 。 这 意味 着 真正 终端 上 的 行规 程 保持 在 规范 模式 下 ， 并 人 允许 回 显 。 
指定 -e 选 项 后 ， 关 掉 了 PTY 从 设备 上 的 行规 程 模 块 的 回 显 。 如 宁 不 这 样 
做 ， 则 键入 的 每 一 个 字符 都 将 被 两 个 行规 程 模块 各 回 显 一 次 。 


fork, exec 
fork pty 
exec 父 进程 
管道 2 


行规 程 


119-15 运行 一 个 协同 进程 ， 以 伪 终 端 作为 其 输入 和 输出 

还 能 用 -e 选 项 关闭 termios 结 构 的 ONLCR 标 六， 以 防止 所 有 协同 进 
程 的 输出 被 回 车 和 换行 符 终 止 。 

在 不 同 的 系统 上 测试 这 个 例子 ， 会 遇 到 14.7 太 中 插 述 readn 和 writen 
函数 时 顺便 提 到 的 同样 问题 。 当 描述 符 引 用 的 不 是 普通 磁盘 文件 时 ， 


从 read 返 回 的 数据 量 可 能 会 因 两 个 实现 之 间 的 不 同 而 有 所 区 别 。 使 用 
pty 的 协同 进程 实例 产生 了 非 预 期 的 结果 ， 其 原因 可 追溯 至 图 15-18 的 程 
序 中 读 管 道 的 read 函 数 ， 它 返回 的 结果 不 足 一 行 。 解 决 方法 是 不 使 用 图 
15-18 中 的 程序 ， 而 是 要 使 用 来 自 于 习题 15.5 针 对 这 个 程序 的 另外 一 个 
版 本 ， 这 个 版 本 改 用 标准 IO 库 ， 将 两 个 管道 的 标准 MO 流 都 设置 为 行 缓 
冲 。 这 样 ，fgets 函 数 将 会 读 完 一 个 整 行 。 图 15-18 的 程序 中 的 while 循 环 
假设 发 送 到 协同 进程 的 每 一 行 都 会 市 来 一 行 的 返回 结 

6. 非 交 互 地 驱动 交互 式 程序 

虽然 让 pty 运 行 任 意 协同 进程 ， 甚 至 交互 式 的 协同 进程 的 想法 很 诱 
人 ， 但 这 是 行 不 通 的 。 问 题 在 于 pty 只 是 将 其 标准 输入 复制 到 PTY， 并 
将 来 目 PTY 的 数据 复制 到 其 标准 输出 ， 而 并 不 关心 具体 发 送 的 或 得 到 
的 是 什么 数据 。 

举 个 例子 ， 我 们 可 以 在 pty 下 运行 telnet 命 令 ， 直 授与 远程 主机 对 
话 : 

pty telnet 192.168.1.3 

这 样 做 与 直接 键入 telnet 192.168.1.3 相 比 ， 并 没有 带 来 更 多 的 好 
处 ， 但 我 们 可 能 希望 在 一 个 脚本 中 运行 telnet 程 序 ， 其 目的 很 可 能 是 
检验 远程 主机 的 某 个 条 件 。 如 果 telnet.cmd 文 件 包 括 下 面 4 行 : 


Sar 


passwd 

uptime 

exit 

第 1 行 是 登录 到 远程 主机 时 使 用 的 用 户 名 ， 第 2 行 是 口令 ， 第 3 行 是 
希望 运行 的 命令 ， 第 4 行 终止 此 会 话 。 如 果 按 下 列 方式 运行 此 脚本 : 

pty -i < telnet.cmd telnet 192.168.1.3 

那么 ， 它 不 会 像 我 们 所 想 的 那样 操作 。 而 是 ，telnet.cmd 文 件 的 内 
容 在 还 没有 得 到 机 会 提示 我 们 输入 账户 名 和 口令 之 前 ， 束 被 发 送 到 了 


远程 主机 。 当 它 关 闭 回 显 而 读 口令 时 ，login 使 用 tcsetattr 选项 ， 于 是 
丢弃 了 已 在 队列 中 的 所 有 数据 。 这 样 一 来 ， 我 们 发 送 的 数据 就 被 丢掉 
des 

当 以 交互 方式 运行 telnet 程 序 时 ， 我 们 等 待 远程 主机 发 出 输入 口令 
的 提示 ， 然 后 再 键入 口令 ， 但 是 pty 程 序 不 知道 这 样 做 。 这 就 是 需要 一 
个 比 pty 更 巧妙 的 程序 ， 如 expect， 从 脚本 文件 驱动 交互 式 程序 的 原 
o 

即使 如 前 所 示 那 样 从 图 15-18 程 序 运行 pty， 这 也 没有 任何 帮助 。 
为 图 15-18 中 的 程序 认为 它 在 一 个 管道 写 入 的 每 一 行 都 会 在 另 一 个 管道 
产生 一 行 。 对 于 一 个 交互 式 程序 ， 输 入 一 行 可 能 产生 多 行 输出 。 更 进 
一 步 ， 图 15-18 中 的 程序 在 从 协同 进程 读 之 前 ， 它 总 是 先 发 送 一 行 给 该 
进程 。 如 果 想 在 发 送 给 协同 进程 一 些 数 据 之 前 从 协同 进程 处 谈 ， 这 种 
RES AT Aik T ° 

有 一 些 从 shell 脚 本 驱动 交互 式 程序 的 方法 。 可 以 在 pty 上 增加 一 种 
命令 语言 和 一 个 解释 器 。 但 是 一 个 适当 的 命令 语言 可 能 十 倍 于 pty 程 序 
的 大 小 。 男 一 种 选择 是 使 用 命令 语言 并 用 pty_fork 函 数 来 调用 交互 式 程 
序 ， 这 正 是 expect 程 序 所 做 的 。 

我 们 将 采用 一 种 不 同 的 途径 ， 使 用 选项 -d 使 pty 程 序 的 输入 和 输出 
与 驱动 进程 连接 起 来 。 该 驱动 进程 的 标准 输出 是 pty 的 标准 输入 ， 反 之 
人 尔 然 。 这 有 点 像 协同 进程 ， 只 是 在 pty 的 “ 另 一 边 ”。 此 种 进程 结构 与 图 
19-15 中 所 示 的 几乎 相同 ， 只 是 在 这 种 场景 中 ， 由 pty 来 完成 驱动 进程 的 
fork 和 和 exec。 而且 我 们 在 pty 和 驱动 进程 二 者 之 间 使 用 的 是 一 个 双 同 的 沈 
管道 ， 而 不 是 两 个 半 双 工 管道 。 

图 19-16 展 示 的 是 do_driver 函 数 的 源 代 码 ， 在 使 用 -d 选 项 时 ， 该 函 
数 由 pty 〈 见 图 19-11) 的 main 函 数 调用 。 


#include "apue.h" 


void 


do driver(char *driver) 


{ 


pid_t child; 
int pipe[2]; 


/* 
* Create a full-duplex pipe to communicate with the driver. 
*/ 
if (fd pipe(pipe) « 0) 
err sys("can't create stream pipe"); 


if ((child = fork()) < 0) { 
err_sys ("fork error"); 

} else if (child == 0) { /* child */ 
close (pipe[1]); 


/* stdin for driver */ 


if (dup2(pipe[0], STDIN FILENO) != STDIN FILENO) 
err sys("dup2 error to stdin"); 


/* stdout for driver */ 


if (dup2(pipe[0], STDOUT FILENO) != STDOUT FILENO) 
err sys("dup2 error to stdout"); 
if (pipe[0] != STDIN FILENO && pipe[0] != STDOUT FILENO) 


close (pipe[0]); 


/* leave stderr for driver alone */ 
execlp(driver, driver, (char *)0); 
err sys("execlp error for: $s", driver); 


close (pipe[0]); /* parent */ 
if (dup2(pipe[1], STDIN FILENO) != STDIN FILENO) 
err sys("dup2 error to stdin"); 
if (dup2(pipe[1], STDOUT FILENO) !- STDOUT FILENO) 
err sys("dup2 error to stdout"); 
if (pipe[1] != STDIN FILENO && pipe[1] != STDOUT FILENO) 


close (pipe[1]); 


/* 
* Parent returns, but with stdin and stdout connected 
* to the driver. 


xy, 


图 19-16 pty 程 序 的 do_driver 函 数 


TEA C38 5 E pty val ASE, "T EAST TER ER BUS 
式 驱 动 交 互 式 程序 。 即 使 驱动 程序 有 和 pty 连 接 在 一 起 的 标准 输入 和 标 
准 输 出 ， 驱 动 进 程 仍然 可 以 通过 读 、 写 /dev/tty 同 用 户 交 互 。 这 个 解决 
方法 仍 不 如 expect 程 序 通用 ， 但 是 它 用 不 到 50 行 的 代码 提供 了 pty 的 一 
种 实用 的 选项 。 


19.7 ZW E 


伪 终 端 还 有 其 他 特性 ， 我们 在 这 里 简略 提 一 下 。Sun 
Microsystems[2002] 和 BSD pts(4) 的 手册 页 对 此 有 更 详细 的 说 明 。 

1. 打包 模式 

打包 模式 (packet mode) 能 够 使 PTY 主 设备 了 解 到 PTY 从 设备 的 状 
态 变 化 。 在 Solaris 系 统 中 ， 可 以 通过 将 STREAMS 模 块 pckt 压 入 PTY 主 
设备 端 来 设置 这 种 模式 。 图 19-2 显 示 了 这 种 可 选 模块 。 在 FreeBSD、 
Linux 和 Mac OS X 中 ， 可 以 用 TIOCPKT ioctl 命 令 来 设置 这 种 模式 。 

Solaris: 和 其 他 平台 相 比 较 ， 具 体 的 打包 模式 有 所 不 同 。 在 Solaris 
中 ， 读 取 PTY 主 设备 的 进程 必须 调用 getmsg HORE HA, eA 
为 pekt 模块 将 一 些 事件 转化 成 了 无 数据 鸭 STREAMS 消 息 。 在 其 他 平台 
中 ， 每 一 次 对 PTY 主 设备 的 读 操作 都 会 返回 珊 有 可 选 数据 的 状态 字 
节 。 

无 论 实现 细 世 如何， 打包 模 式 的 目的 是 ， 当 PTY 从 设备 上 的 行规 
程 模块 出 现 以 下 事件 时 ， 通 知 进程 从 PTY 主 设备 读 取 数据 : 读 队 列 被 
冲洗 ， 写 队列 被 冲洗 ， 输 出 被 停止 (如 Ctrl+S) ， 输 出 重新 开始 ， 
XON/XOFF 流 控制 被 禁用 后 重新 启用 ，XON/XOFF Jide rl fi o Fi Je E 
新 禁用 。 这 些 事 件 由 rlogin 客 户 进程 和 rlogind 服 务 器 进程 使 用 。 

2. 远程 模式 


PTY 主 设备 可 以 用 TIOCREMOTE ioctl 命 令 将 PTY 从 设备 设置 成 远 
程 模式 。 虽 然 FreeBSD、Mac OS X 10.6.8 和 Solaris 10 使 用 同样 的 命令 来 
启用 或 禁用 这 个 特性 ， 但 是 在 Solaris 中 ，ioctl 的 第 三 个 参数 是 一 个 整 型 
数 ， 而 在 Mac OS X 中 则 是 一 个 指 问 整 型 数 的 指 和 守 。 (FreeBSD 8.0 和 
Linux 3.2.0 不 支持 这 一 命令 。) 

当 PTY 主 设备 将 PTY 从 设备 设置 成 这 种 模式 时 ， 它 通知 PTY 从 设备 
上 的 行规 程 模块 对 从 主 设备 接收 到 的 任何 数据 都 不 进行 任何 处 理 ， 不 
管 从 设备 termios 结构 中 的 规范 或 非 规范 标志 是 否 设置 ， 都 是 这 样 。 远 
程 模 式 适 用 于 窗口 管理 器 这 种 进行 自己 的 行 编辑 的 应 用 程序 。 

3. 窗口 大 小 变化 

PTY 主 设备 上 的 进程 可 以 用 TIOCSWINSZ ioctl 命 令 来 设置 从 设备 
的 窗口 大 小 。 如 果 新 的 大 小 和 当前 的 大 小 不 同 ，SIGWINCH 信 号 将 被 
发 送 到 PTY 从 设备 的 前 台 进 程 组 。 

4. 信号 发 生 

读 、 写 PTY 主 设备 的 进程 可 以 向 PTY 从 设备 的 进程 组 发 送信 号 。 在 
Solaris 10 中 ， 可 以 用 TIOCSIGNAL ioctl 命 令 做 到 这 一 点 。 在 FreeBSD 
8.0 ^ Linux 3.2.0 和 Mac OS X 10.6.8 中 ， 用 TIOCSIG ioct 来 做 到 这 一 
点 。 在 这 两 种 情况 下 ， 第 三 个 参数 都 是 信号 编号 值 。 


19.8 小 结 


本 章 开 始 部 分 简要 叙述 了 如 何 使 用 伪 终 端 ， 并 观察 了 某 些 应 用 实 
例 。 接 着 ,分 析 说 明了 在 本 书 讨论 的 4 种 平台 上 打开 伪 终 端 所 需 的 代 
码 。 然 后 用 此 代码 提供 了 通用 pty_fork 范 数 ， 它 可 用 于 多 种 不 同 的 应 
用 。 该 函数 是 小 程序 (pty) 的 基础 ， 我 们 使 用 这 一 程序 揭示 了 伪 终 端 
的 许多 属性 。 


伪 终 端 在 大 多 数 UNIX 系 统 中 每 天 都 被 用 来 进行 网 络 登 录 。 我 们 还 
检查 了 伪 终 端的 许多 其 他 用 途 ， 从 script 程 序 到 使 用 批 处 理 脚本 来 驱动 
交互 式 程序 等 。 


习题 


19.1 当 用 telnet 或 rlogin 远 程 登录 到 一 个 BSD 系 统 上 时 ， 像 我 们 在 
19.3 世 讨论 过 的 那样 ， PTY 从 设备 的 所 有 权 和 权限 被 设置 。 该 过 程 是 
如 何 发 生 的 ? 

19.2 使 用 pty 程 序 来 确定 你 的 系统 用 于 初始 化 PTY 从 设备 的 termios 
结构 和 winsize 结 构 的 值 。 

19.3 重 写 loop 函 数 〈 见 图 19-12) ， 使 之 成 为 使 用 select 或 poll 的 单 
个 进程 。 

19.4 在 子 进 程 中 ，pty_fork 返 回 后 ， 标 准 输入 、 标 准 输出 和 标准 销 
误 都 以 读 写 模式 打开 。 能 够 将 标准 输入 变 成 只 读 ， 男 两 个 变 成 只 写 
吗 ? 

19.5 在 图 19-13 中 ， 指 出 哪些 进程 组 是 前 台 的 ， 哪 些 进程 组 是 后 台 
的 ， 并 指出 会 话 自 进程 。 

19.6 在 图 19-13 中 ， 当 键入 文件 终止 符 时 ， 进 程 终止 的 顺序 是 什 
A? 如 果 可 能 的 话 ， 用 进程 会 计 信息 验证 之 。 

19.7 script(1) 程 序 通 常 在 输出 文件 头 增加 一 行 说 明 它 的 开始 时 间 ， 
在 输出 文件 末尾 增加 一 行 说明 它 的 结束 时 间 。 将 这 些 特性 添加 到 本 章 
展示 的 简单 的 shell 脚 本 中 。 

19.8 解释 为 什么 在 下 面 的 例子 中 ， 即 使 程序 ttyname ( 见 图 18- 
16) 只 产生 输出 而 不 读 入 的 情况 下 ， 文 件 data 的 内 容 还 被 输出 到 终端 
JI 


$ cat data 一 个 两 行 的 文件 
hello, 


world 

$ pty -i « data ttyname -i -ji 表示 忽略 stdin 的 文件 结束 标志 
hello, 这 两 行 来 目 何 处 ? 

world 

fd 0:/dev/ttys005 我 们 期 望 ttyname 输 出 这 3 行 
fd 1:/dev/ttys005 

fd 2:/dev/ttys005 


19.9 编写 一 个 调用 pty_fork 的 程序 ， 该 程序 有 一 个 子 进程 ， 该 子 进 
程 exec 另 一 个 你 写 的 程序 。 子 进程 exec 的 新 程序 能 够 捕获 SIGTERM 和 
SIGWINCH 。 当 捕获 到 信号 时 ， 要 打印 出 有 关 消 息 ， 并 且 对 于 后 一 种 
言 号 ， 还 要 打印 终端 窗口 大 小 。 然 后 让 父 进程 用 19.7 节 描 述 过 的 ioctl 
命令 向 PTY 从 设备 的 进程 组 发 送 SIGTERM 信 和 号。 从 PTY 从 设备 读 回 消 
息 并 验证 捕获 到 了 该 信号 。 接 下 来 由 父 进程 设置 PTY 从 设备 窗口 的 大 
小 ， 并 再 读 回 PTY 从 设备 的 输出 。 让 父 进 程 退出 (exit) 并 确定 PTY 从 
设备 进程 是 否 也 要 终止 ， 如 果 要 终止 ， 应 如 何 终止 ? 
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20.1 引言 


20 世 纪 80 年 代 早 期 ，UNIX 系 统 被 认为 不 适合 运行 多 用 户 数据 库 系 
Zi 〈《 见 Stonebraker[1981] 和 Weinberger[1982]) 。 早期 的 系统 (如 
V7) ， 因 为 没有 提供 任何 形式 的 IPC 机 制 〈 除 了 半 双 工 管道 ) ， 也 没有 
提供 任何 形式 的 字 节 范围 锁 机 制 ， 所 以 确实 不 适合 运行 多 用 户 数据 库 
系统 。 但 是 ， 这 些 缺 陷 中 的 大 多 数 都 已 得 到 纠正 。 到 20 世 纪 了 80 年 代 
后 期 ，UNIX 系 统 已 为 运行 可 靠 的 、 多 用 户 的 数据 库 系 统 提 供 了 一 个 适 
合 的 环境 。 目 那 时 以 来 ， 很 多 商业 公司 都 已 提供 这 种 数据 库 系 统 。 

本 章 将 开发 一 个 简单 的 、 多 用 户 数 据 库 的 C 了 范 数 库 。 调 用 此 函数 库 
提供 的 C 语 言 函 数 ， 其 他 程序 可 以 获取 和 存储 数据 库 中 的 记录 。 (这 类 
数据 库 通常 被 称 为 键 - 值 存 储 。) 这 个 C EER ET BARE 
系统 的 一 部 分 ， 我 们 并 不 开发 其 他 部 分 (如 查询 语言 等 ， 关 于 其 他 
部 分 可 以 参阅 专门 介绍 数据 库 的 教科 书 。 我 们 感 兴趣 的 是 数据 库 函 数 
库 与 UNIX 的 接口 ， 以 及 这 些 接口 与 前 面 各 章节 所 涉及 主题 的 关系 (如 
14.3 B NF TEBE) 。 


20.2 历史 


dbm(3) Œ — A YEUNIX A Zi F AR Vit 47 AY BN Hi PE ER SEE, E EH Ken 
Thompson 开 发 ， 使 用 了 动态 散 列 结构 。 最 初 ， 它 与 V7 一 起 提供 ， 并 出 
HE Pr BSDR P, EE S fESVRABJBSDJ3ER Zi ER BY FE "P [AT&T 
1990c] ° BSDISFA- IR E f dbmENZIUEE, FFE EI Andbm ° ndbmEA 
ZUE E $5 EBSD AISVR4# ° ndbm K ZI z& Single UNIX Specification) 
XSI 扩 展 标 准 的 一 部 分 。 

Seltzer 和 Yigit[1991] 中 详细 介绍 了 dbm 函 数 麻 使 用 的 动态 散 列 算法 
的 历史 ， 以 及 这 个 库 的 其 他 实现 方法 ， 如 dbm 函 数 库 的 GNU 版 本 
gdbm。 但 是 ， 这 些 实现 的 一 个 根本 限制 是 它们 都 不 文 持 多 个 进程 对 数 
据 库 的 并 发 更 新 。 它 们 都 没有 提供 并 发 控制 《如 记录 锁 机 制 ) 。 

4.4BSD 提 供 了 一 个 新 的 库 一 -db(3)， 该 库 文 持 3 种 不 同 的 访问 模 
式 : 面向 记录 、 散 列 和 B 树 。 同 样 ，db 也 没有 提供 并 发 控制 (这 一 点 在 
db(3) 手 册页 的 BUGS 部 分 说 得 很 清楚 ) 。 

Oracle (http://www.oracle.com) 提供 了 几 个 版 本 的 db 函数 库 ， 它 
们 支持 并 发 访问 、 锁 机 制 和 事务 。 

大 部 分 商用 数据 库 函 数 库 提供 多 进程 同时 更 新 数据 库 所 需要 的 并 
发 控制 。 这 些 系统 一 般 都 使 用 14.3 广 中 介绍 的 建议 记录 锁 机 制 ， 但 是 ， 
它们 也 常常 实现 目 己 的 锁 原 语 ， 以 避免 为 获得 一 把 无 竞争 锁 而 需 的 系 
统 调用 开销 。 这 些 商用 系统 通常 用 B+ 树 [Comer 1979] 或 某 种 动态 散 列 技 
术 ， 如 线性 散 列 [Litwin 1980] 或 者 可 扩展 的 散 列 [Fagin et al. 1979] 来 实 
现 数据 库 。 

图 20-1 列 出 了 本 书 说 明 的 4 种 操作 系统 常用 的 数据 库 函 数 库 。 注 意 
在 Linux 上 ，gdbm 库 既 支 持 dbm 函 数 库 ， 又 支持 ndbm 函 数 库 。 


函数 库 POSIX.1 FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 Solaris 10 


dbm gdbm ° 
ndbm XSI ° gdbm . . 
db . . . 


图 20-1 多 种 平台 文 持 的 数据 库 函 数 库 


20.3 ERA 


本 章 开 发 的 函数 库 类 似 于 ndbm 函 数 库 ， 但 增加 了 并 发 控制 机 制 ， 
Mig for Ze ET [e] EST BE zm [8] — A FE. ^. ZRCTECREBI Sic Fe ole A HE ER USE 
的 C 语 言 接 口 ， 下 一 再 讨论 其 实现 。 

当 打 开 一 个 数据 库 时 ， 通 过 返回 值得 到 一 个 代表 数据 库 的 句柄 

(一 个 不 透明 指针 ) 。 将 用 此 句柄 作为 参数 来 调用 其 他 数据 库 函 数 。 

#include "apue db.h" 

DBHANDLE db open(const char *pathname, int oflag, ... /* int mode 
*/); 

返回 值 : 在 成 功 ， 返 回 数据 库 句 柄 ; ERW, X«BINULL 
void db close(DBHANDLE db); 

如 果 db_open 成 功 返 回 ， 则 将 建立 两 个 文件 : pathname.idx 和 
pathname.dat, ，pathname.idx 是 索引 文件 ，pathname.dat 是 数据 文件 。 参 
数 oflag 作 为 传递 给 open (01.3.35). 的 第 二 个 参数 ， 来 指定 这 些 文件 的 
打开 模式 (只 读 、 读 / 写 或 如 果 文 件 不 存在 则 创建 等 ) 。 如 果 需 要 建立 
新 的 数据 库 ，mode 将 作为 第 三 个 参数 传递 给 open (文件 访问 权限 ) 。 

当 不 再 使 用 数据 库 时 ， 调 用 db_close 来 关闭 数据 库 。db_close 将 天 
闭 索 引文 件 和 数据 文件 ， 并 释放 数据 库 使 用 过 程 中 分 配 到 的 所 有 用 于 
内 部 缓冲 区 的 存储 空间 。 

当 回 数据 库 中 存 入 一 条 新 的 记录 时 ， 必 须 提 供 一 个 此 记录 的 键 ， 
以 及 与 此 键 相 关联 的 数据 。 如 有 果 此 数据 库存 储 的 是 人 事 信 息 ， 键 可 以 
是 员工 ID ， 数 据 可 以 是 此 员工 的 姓名 、 地 址 、 电 话 号 码 以 及 受聘 日 期 


等 。 实 现 要 求 每 条 记录 的 键 必 须 是 唯一 的 〈 例 如 ， 不 会 有 两 个 员工 记 
录 有 同样 的 员工 ID) 
#include "apue db.h" 
int db stor(DBHANDLE db, const char *key, const char *data, int 
flag); 
返回 值 : ERD, Eo; 大 出 错 ， 返 回 非 0 值 〈 见 下 ) 
key 和 data 是 由 null 字 符 终 止 的 字符 串 。 它 们 可 以 包含 除了 null 字 符 
外 的 任何 字符 ， 如 换行 符 。 
flag 参 数 只 能 是 DB_INSERT (插入 一 条 新 记录 ) 、DB_REPLACE 
(替换 一 条 已 有 的 记录 ) 或 DB_STORE (插入 一 条 新 记录 或 替换 一 条 
已 有 的 记录 ， 只 要 合适 无 论 哪 一 种 都 可 以 ) 。 这 3 个 常数 定义 在 
apue db.h 头 文件 中 。 如 果 使 用 DB_INSERT 或 DB_STORE， 并 且 记 录 
并 不 存在 ， 则 插入 一 条 新 记录 。 如 果 使 用 DB_REPLACE 或 
DB_STORE， 并 且 该 记录 已 经 存在 ， 则 用 新 记录 蔡 换 已 有 记录 。 如 采 
使 用 DB_REPLACE， 而 记录 不 存在 ， 则 将 ermo 设 置 为 ENOENT， 返 回 
值 为 -1， 并 且 不 加 入 新 记录 。 如 果 使 用 DB_INSERT， 而 记录 已 经 存 
在 ， 则 不 播 入 新 记录 ， 返 回 值 为 1。 在 这 里 ， 返 回 1 以 区 别 于 一 般 的 出 
错 返 回 (-1) 
通过 指定 键 key 可 以 从 数据 库 中 获取 一 条 记录 。 
#include "apue db.h" 
char *db_fetch(DBHANDLE db, const char *key); 
IRENE: 者 成 功 ， 返 回 指 回 数据 的 指针 ; CPG, JXIRINULL 
如 果 找 到 了 记录 ， 返回 指向 通过 key 存 放 的 数据 的 指针 。 通 过 指定 
key， 也 可 以 在 数据 库 中 删除 一 条 记录 © 
#include "apue db.h" 
int db delete(DBHANDLE db, const char *key); 
REME: AaB, 3R[BO; 在 没 有 找到 记录 ， 返 回 -1 


除了 通过 指定 key 获 取 记 录 外 ， 还 可 以 逐条 记录 地 访问 数据 库 。 为 
此 ， 百 先 调用 db_rewind 回 深 到 数据 库 的 第 一 条 记录 ， 然 后 在 每 一 次 循 
环 中 调用 db_nextrec， 顺 序 地 读 每 条 记录 。 

#include "apue_db.h" 

void db_rewind(DBHANDLE db); 

char *db nextrec(DBHANDLE db, char *key); 

REME: AA, EREET: PASTE CIBUS, 
返回 NULL 

如 果 key 是 非 空 指针 ，db_nextrec 将 这 个 指针 复制 到 存储 区 域 开 始 
的 内 存 位 置 ， 然 后 返回 这 个 指针 。 

db_nextrec 不 保证 其 返回 记录 的 顺序 ， 只 保证 对 数据 库 中 的 每 一 条 
记录 只 读 取 一 次 。 如 果 顺 序 存储 3 条 键 分 别 为 A、B、C 的 记录 ， 则 无 法 
确定 db_nextrec 将 按 什 么 顺序 返回 这 3 条 记录 。 它 可 能 按 B、A、C 的 顺 
序 返 回 ， 也 可 能 按 其 他 顺序 。 实 际 的 顺序 由 数据 库 的 实现 决定 。 

这 7 个 函数 提供 了 数据 库 函 数 库 的 接口 。 接 下 来 介绍 实现 。 


20.4 实现 概述 


访问 数据 库 的 函数 库 通 币 使 用 两 个 文件 来 存储 信息 : 一 个 索引 文 
件 和 一 个 数据 文件 。 索 引文 件 包括 实际 的 索引 值 GE) 和 一 个 指向 数 
据 文件 中 对 应 数据 记 杂 的 指针 。 有 许多 技术 可 用 来 组 织 索 引文 件 以 提 
高 按键 查询 的 速度 和 效率 ， 散 列表 和 B+ 树 是 两 种 常用 的 技术 。 我 们 采 
用 固定 大 小 的 艇 列表 来 组 织 索引 文件 结构 ， 并 采用 链 才 法 解决 散 列 冲 
突 。 在 介绍 db_open 时 ， 曾 提 到 将 创建 两 个 文件 : 一 个 以 .idx 为 后 绥 的 
索引 文件 和 一 个 以 .dat 为 后 缀 的 数据 文件 。 


我 们 将 键 和 索引 以 nu 结尾 的 字符 串 形 式 存 储 ， 它 们 不 能 包含 任意 
的 二 进 制 数据 。 有 些 数据 库 系统 用 二 进 制 形 式 存 储 数值 数据 (如 用 1 
个 、2 个 或 4 个 字 节 存储 一 个 整数 ) 以 节省 存储 空间 ， 这 样 一 来 使 函数 
复杂 化 ， 也 使 数据 库 文 件 在 不 同 的 平台 间 移 植 比较 困难 。 例 如 ， 网 络 
上 有 两 个 系统 使 用 不 同 的 二 进 制 格式 存储 整数 ， 如 采 想 要 这 两 个 系统 
都 能 够 访问 数据 库 ， 束 必须 解决 不 同 存 储 格式 的 问题 (今天 不 同体 系 
结构 的 系统 在 网 络 上 共享 文件 已 经 很 常见 了 ) 。 按 照 字符 串 形 式 存储 
所 有 的 记录 ， 包 括 键 和 数据 ， 能 使 这 一 切 变 得 简单。 这 确实 需要 使 用 
更 多 的 磁盘 空间 ， 但 降低 了 获得 可 移植 性 需要 付出 的 代价 。 

db_store 要 求 对 于 每 个 键 ， 只 有 一 条 对 应 的 记录 。 有 些 数据 库 系 统 
允许 多 条 记录 使 用 同样 的 键 ， 并 提供 方法 访问 与 一 个 键 相 关 的 所 有 记 
杂 。 男 外 ， 我 们 只 有 一 个 索引 文件 ， 这 意味 着 每 个 数据 记 杂 只 能 有 一 
个 键 我们 不 支持 次 键 ) 。 有 些 数据 库 允 许 一 条 记录 拥有 多 个 键 ， 并 
且 对 每 一 个 键 使 用 一 个 索引 文件 。 当 插入 或 删除 一 条 记录 时 ， 要 对 所 
有 的 索引 文件 进行 相应 的 修改 。 《一 个 拥有 多 个 索引 的 例子 是 员工 库 
文件 。 可 以 将 员工 ID 作为 键 ， 也 可 以 将 员工 的 社会 体 险 号 作为 健 。 由 
于 员工 的 名 字 并 不 保证 唯一 ， 所 以 名 字 不 能 作为 键 。) 

图 20-2 是 数据 库 实现 的 基本 结构 。 


空闲 链表 中 第 一 条 
索引 记录 的 偏 移 量 


散 列表 


索引 记录 


该 散 列 链表 中 第 一 条 di 
索引 记录 的 偏 移 量 d 


该 散 列 链表 中 下 一 条 
索引 记录 的 偏 移 量 


数据 文件 : 


| 数据 记录 长 度 | 


图 20-2 索引 文件 和 数据 文件 结构 


索引 文件 由 3 部 分 组 成 : 空闲 链表 指针 、 散 列表 和 索引 记录 。 图 20- 
2 中 ， 所 有 指针 字段 中 实际 存储 的 是 ASCII 码 数字 形式 的 文件 偏 移 量 。 

当 给 定 一 个 键 ， 要 在 数据 库 中 寻找 一 条 记录 时 ，db_fetch 根 据 该 键 
计算 散 列 值 ， 由 此 散 列 值 可 确定 一 条 散 列 链 (链表 指针 字段 可 以 为 0， 
表示 一 条 空 的 散 列 链 ) 。 沿 着 这 条 散 列 链 ， 可 以 找到 所 有 上 有 具有 这 一 散 
列 值 的 索引 记录 。 当 遇 到 一 个 索引 记录 的 链表 指针 字段 为 0 时 ， 表 示 到 
达 了 此 向 列 链 的 末尾 。 


下 面 来 看 一 个 实际 的 数据 库 文件 。 图 20-3 所 示 的 程序 建立 了 一 个 新 
的 数据 库 ， 并 且 写 入 了 3 条 记录 。 由 于 所 有 的 字段 都 以 ASCII 字 符 的 形 
式 存 储 在 数据 库 中 ， 所 以 可 以 用 任何 标准 的 UNIX 系 统 工 具 来 查看 索引 
文件 和 数据 文件 : 
$ Is -1 db4.* 
-IW-r--r-- 1 sar 28 Oct 19 21:33 db4.dat 
-IW-r--r-- 1 sar 72 Oct 19 21:33 db4.idx 
$ cat db4.idx 
053350 
0 10Alpha:0:6 
0 10beta:6:14 
17 11gamma:20:8 
$ cat db4.dat 
data1 
Data for beta 


record3 

23 f fio PIT AR, RE MBET FERIA AAT ASCII 
符 ， 将 散 列 链 的 数量 设置 为 3 条 。 由 于 每 一 个 指针 中 记录 的 是 一 个 文件 
偏 移 量 ， 所 以 4 个 ASCII 字 符 限制 了 一 个 索引 文件 或 数据 文件 的 大 小 最 
多 只 能 为 10 000 字 方 。 当 在 20.9 广 做 性 能 测试 时 ， 将 指针 字段 的 大 小 设 
为 6 个 字符 (这 样 文件 大 小 可 以 达到 1 000 000 字 节 ) ， 将 散 列 链 数 量 设 
74100 ° 


#include "apue.h" 
#include "apue db.h" 
#include «fcntl.h» 


int 
main (void) 
( 
DBHANDLE db; 


if ((db = db open("db4", O_RDWR | O CREAT | O TRUNC, 
FILE MODE)) -- NULL) 
err sys("db open error"); 


if (db store(db, "Alpha", "datal", DB INSERT) !- 0) 
err quit("db store error for alpha"); 

if (db store(db, "beta", "Data for beta", DB INSERT) != 0) 
err quit("db store error for beta"); 

if (db store(db, "gamma", "record3", DB INSERT) != 0) 
err quit("db store error for gamma"); 


db close (db); 
exit(0); 


图 20-3 建立 一 个 数据 库 并 写 入 3 条 记录 

索引 文件 的 第 一 行为 : 

053 35 0 

分 别 为 空闲 链表 指针 (0 表示 空间 链表 为 空 ) 和 3 个 散 列 链 的 指 
£I: 53 * 35300 ec fs 

0 10Alpha:0:6 

显示 了 一 条 索引 记录 的 结构 。 第 一 个 4 字符 字段 (0) 为 链表 指 
针 ， 表 示 这 一 条 记录 是 此 散 列 链 的 最 后 一 条 。 下 一 个 4 字符 字段 (10) 
为 idx len (索引 记录 长 度 ) ， 表 示 此 索引 记录 剩余 部 分 的 长 度 。 用 两 个 
read 操 作 来 读 取 一 条 索引 记录 : 第 一 个 read 读 取 这 两 个 固定 长 度 的 字段 

(链表 指针 和 索引 记录 长 度 ) ， 然 后 再 根据 索引 记录 长 度 来 读 取 后 面 

的 不 定 长 部 分 。 剩 下 的 3 个 字段 为 : 键 、 数 据 记录 的 偏 移 量 和 数据 记录 
的 长 度 。 这 3 个 字段 用 分 隅 符 隔 开 ， 此 处 使 用 的 分 隔 符 是 冒号 。 由 于 
这 3 个 字段 都 是 不 定 长 的 ， 所 以 需要 一 个 专门 的 分 隔 符 ， 而 且 这 个 分 隔 
符 不 能 出 现在 键 中 。 最 后 用 一 个 m (换行 符 ) 结束 这 一 条 索引 记录 。 由 


于 在 索引 记录 长 度 字 段 中 已 经 有 了 记录 的 长 度 ， 所 以 这 个 换行 从 并 不 
是 必需 的 ， 加 上 换行 符 是 为 了 把 各 条 索引 记录 分 开 ， 这 样 束 可 以 用 标 
准 的 UNIX 系 统 工具 (如 cat 和 more) 来 查看 索引 文件 。 键 字段 是 将 记录 
写 入 数据 库 时 指定 的 值 。 数 据 记 录 在 数据 文件 中 的 偏 移 量 为 0， 长 度 为 
6。 从 数据 文件 中 可 看 到 数据 记录 确实 从 0 开始 ， 长 度 为 6 个 字 和 。 (与 
索引 文件 一 样 ， 这 里 目 动 在 每 条 数据 记录 的 后 面 妃 加 一 个 换行 符 ， 以 
便于 使 用 UNIX 系 统 工 具 。 在 调用 db_fetch 时 ， 此 换行 符 不 作为 数据 返 
回 。) 

如 果 在 这 个 例子 中 跟踪 3 条 散 列 链 ， 可 以 看 到 第 一 条 散 列 链 上 第 

条 记录 的 偏 移 量 是 53 (gamma) 。 这 条 链 上 下 一 条 记录 的 偏 移 量 为 
17 (alpha) ， 并 且 是 这 条 链 上 的 最 后 一 条 记录 “。 第 二 条 散 列 链 上 的 第 
条 记录 的 偏 移 量 是 35 (beta) ， 且 是 此 链 上 最 后 一 条 记录 。 第 三 条 散 

列 链 为 空 。 

请 注意 ， 索 引文 件 中 键 的 顺序 和 数据 文件 中 对 应 数据 记录 的 顺序 
与 图 20-3 程序 中 调用 db_store 的 顺序 一 样 。 由 于 在 调用 db_open 时 使 用 
了 O_TRUNC 标 志 ， 索 引文 件 和 数据 文件 都 被 规 断 了 ， 整 个 数据 库 相 当 
于 重新 初始 化 。 在 这 种 情况 下 ，db_store 将 新 的 索引 记录 和 数据 记录 追 
加 到 对 应 的 文件 末尾 。 后 面 将 看 到 ，db_store 还 可 以 重复 使 用 这 两 个 文 
件 中 已 删除 记录 原来 对 应 购 空间 。 

使 用 固定 大 小 的 散 列 表 作 为 索引 是 一 个 妥协 。 当 每 个 散 列 链 都 不 
太 长 时 ， 这 个 方法 能 你 证 快速 地 访问 。 我 们 的 目的 是 能 够 快速 地 查找 
任 一 键 ， 同 时 又 不 使 用 太 复 杂 的 数据 结构 (如 B 树 或 动态 散 列 表 ) 。 动 
态 散 列表 的 优点 是 能 保证 仅 用 两 次 磁盘 存 取 就 能 找到 数据 记录 ( 详 见 
Litwin[1980] 或 Fagin 等 [1979]) 。B 树 能 够 用 (已 排序 的 ) 键 的 顺序 来 
遍历 数据 库 (采用 散 列 表 的 db_nextrec 函 数 就 做 不 到 这 一 点 ) 。 


20.5 IM T 


4A ZNE EREE, PPT YA n] KE R o 

(1) 集中 式 。 由 一 个 进程 作为 数据 库 管 理 者 ， 所 有 的 数据 库 访 问 
工作 由 此 进程 完成 。 其 他 进程 通过 IPC 机 制 与 此 中 心 进 程 进行 联系 。 

(2) 非 集 中 式 。 每 个 库 函 数 使 用 要 求 的 并 发 控制 CON) ， 然 后 
发 起 自己 的 IO 函数 调用 。 

使 用 这 两 种 技术 的 数据 库 系统 都 有 。 如 果 有 适当 的 加 锁 例 程 ， 因 
为 避免 了 使 用 IPC， 那 么 非 集 中 式 方 法 一 般 要 快 一 些 。 图 20-4 描 绘 了 集 
中 式 方 法 的 操作 。 

图 中 特意 表示 出 IPC 像 绝 大 多 数 UNIX 系 统 的 消息 传递 一 样 需要 经 
过 操作 系统 内 核 〈15.9 节 中 说 明 的 共享 存储 不 需要 这 种 经 过 内 核 的 复 
制 ) 。 在 集中 方式 下 ， 中 心 控制 进程 将 记录 读 出 ， 然 后 通过 IPC 机 制 将 
数据 传递 给 请 求 进程 。 这 是 这 种 设计 的 不 足 之 处 。 注 意 ， 集 中 式 数据 
库 管 理 进 程 是 唯一 对 数据 库 文件 进行 VO 操作 的 进程 。 

集中 式 的 优点 是 能 够 根据 需要 来 对 操作 模式 进行 调整 。 例 如 ， 可 
以 通过 中 心 进程 给 不 同 的 进程 赋予 不 同 的 优先 级 ， 这 会 影响 到 中 心 进 
程 对 LO 操作 的 调度 。 而 用 非 集中 式 方 法 则 很 难 做 到 这 一 点 。 在 这 种 情 
况 下 ， 只 能 依赖 于 操作 系统 内 核 的 磁盘 VO 调度 策略 和 加 锁 策略 〈 例 
如 ， 当 3 个 进程 同时 等 待 一 个 即将 可 用 的 锁 时 ， 我 们 无 法 确定 哪个 进程 
将 得 到 这 个 锁 ) 。 

集中 式 方法 的 男 一 个 优点 是 ， 恢 复 要 比 非 集中 式 方 法 容易 。 在 和 集 
中 式 方法 中 ， 所 有 状态 信息 都 集中 存放 在 一 处 ， 所 以 如 若 杀 死 了 数据 
库 进 程 ， 只 需 在 该 处 查看 以 识别 出 需要 解决 的 未 完成 事务 ， 然 后 将 数 
据 库 恢 复 到 一 致 状态 。 
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图 20-4 集中 式 数据 库 访问 
图 20-5 描 绘 了 非 集 中 式 方法 ， 本 章 的 实现 束 是 采用 这 种 方法 。 


用 户 进程 用 户 进程 


图 20-5 非 集中 式 数据 库 访问 


调用 数据 库 库 函数 执行 JO 的 用 户 进程 是 合作 进程 ， 它 们 使 用 字 古 
苑 围 记录 锁 机 制 来 实现 并 发 控制 。 


20.6 并 发 


由 于 很 多 系统 的 实现 都 采用 两 个 文件 (一 个 索引 文件 和 一 个 数据 
文件 ) 的 方法 ， 所 以 在 此 也 使 用 这 种 方法 ， 这 要 求 能 够 控制 对 两 个 文 
件 的 加 锁 。 有 很 多 方法 可 用 来 对 两 个 文件 进行 加 锁 。 

1. 粗 粒度 锁 

最 简单 的 加 锁 方 法 是 将 这 两 个 文件 中 的 一 个 作为 整个 数据 库 的 
锁 ， 并 要 求 调用 者 在 对 数据 库 进 行 操 作 前 必须 获得 这 个 锁 。 这 种 加 锁 
方式 称 为 粗 粒 度 锁 (coarse-grained locking) 。 例 如 ， 可 以 认为 一 个 进 
程 对 索引 文件 的 0 字 世 加 了 读 锁 后 ， 才 能 读 整 个 数据 库 ; 一 个 进程 对 索 
引文 件 的 0 字 节 加 了 写 锁 后 ， 丈 能 写 整 个 数据 库 。 可 以 使 用 UNIX 系 统 
的 字 广 范围 锁 机 制 来 控制 每 次 可 以 有 多 个 读 进程 ， 而 只 能 有 一 个 写 进 
fe ( 见 图 14-3) © db fetch 和 db nextrec 范 数 要 求 具 有 读 锁 ， 而 
db_delete、db_store 和 db_open 则 要 求 具 有 写 锁 。 (db_open 要 求 写 锁 的 
原因 是 如 果 要 创建 新 文件 的 话 ， 要 在 索引 文件 前 端 建立 空 采 区 链表 以 
及 散 列 链表 。) 

粗 粒 度 锁 的 问题 是 它 限制 了 并 发 。 用 粗 六 度 锁 时 ， 当 一 个 进程 向 
一 条 散 列 链 中 添加 一 条 记录 时 ， 其 他 进程 无 法 访问 男 一 条 散 列 链 上 的 
记录 

2. 细 粒 度 锁 

细 粒 度 锁 (fine-grained locking) 的 方法 改进 了 粗 粒 度 锁 ， 提 供 了 
更 高 的 并 发 性 。 一 个 读 进程 或 写 进程 在 操作 一 条 记录 前 必须 先 获得 此 
记录 所 在 散 列 和 链 的 读 锁 或 写 锁 。 一 条 散 列 链 人 允许 同 时 有 多 个 读 进 程 ， 
但 只 能 有 一 个 写 进程 。 其 次 ， 一 个 写 进程 在 访问 空闲 区 链表 (如 
db delete 或 db_store) 前 ， 必 须 获得 空间 区 链表 的 写 锁 。 最 后 ， 当 
db_store 癌 索引 文件 或 数据 文件 末尾 追加 一 条 新 记录 时 ， 必 须 获得 对 应 
文件 相应 区 域 的 写 锁 。 

期 望 细 粒 度 锁 能 比 粗 粒 度 锁 能 提供 更 高 的 并 发 性 。20.9 市 将 给 出 
一 些 实际 的 比较 测试 结果 。20.8 布 给 出 了 细 粒 度 锁 实现 的 源 代 码 ， 并 


WICH AN 〈 粗 粒度 锁 是 这 个 细 粒 度 锁 实 现 的 简化 ) 。 

在 源 代 码 中 ， 直 接 调 用 了 read、readv、write 和 writev。 没 有 使 用 标 
准 IO 画 数 库 。 虽 然 使 用 标准 MO 画 数 库 也 可 以 使 用 字 节 范围 锁 ， 但 是 需 
要 非常 复杂 的 缓冲 管理 。 人 例如， 标准 MO 缓冲 区 的 数据 在 5 分 钟 之 前 被 另 
一 个 进程 修改 了 ， 那 么 我 们 或 不 希望 fgets 返 回 的 数据 是 10 分 钟 之 前 读 
入 标准 1/O 绥 冲 区 的 数据 。 

以 上 对 并 发 的 讨论 依据 的 是 对 数据 库 函 数 库 的 简单 需求 。 商 业 系 
统一 般 有 更 多 的 需要 。 关 于 并 发 更 多 的 细 世 可 以 参见 Data[2004] 的 第 16 


I 


FAL 9 


20.7 EKRE 


数据 库 的 函数 库 由 两 个 文件 构成 ， 一 个 公用 的 C 头 文件 以 及 一 个 C 
产 文 件 。 我 们 可 以 用 下 列 命令 构造 一 个 静态 函数 库 。 
gcc -I../include -Wall -c db.c 
ar rsv libapue db.a db.o 
Ex] 7 34] VE SCR E ER RUE "P EFI ET A Sa, BT 
以 希望 与 libapue_db.a 相 连接 的 应 用 程序 也 需要 与 libapue.a 相 连接 。 
另 一 方面 ， 如 果 想 构建 数据 库 函 数 库 的 动态 共享 库 版 本 ， 可 使 用 
BIS: 
gcc -I../include -Wall -fPIC -c db.c 
gcc -shared -Wl,-soname,libapue db.so.1 -o libapue_db.so.1 \ 
-L../lib -lapue -lc db.o 
构建 成 的 共享 库 libapue db.so.1 需 放 置 在 动态 连接 程序 / 载 入 程序 
(dynamic linker/loader) 能 够 找到 的 一 个 公用 目录 中 。 还 可 以 将 共享 库 


放置 在 一 个 私有 目录 中 ， 修 改 LD_LIBRARY_PATH 环境 变量 ， 使 动态 
连接 程序 / 载 入 程序 的 搜索 路 径 包 含 该 私有 目录 。 

在 不 同 平 台 间 ， 构 建 共 享 库 的 步骤 会 有 所 不 同 。 这 里 说 明 的 步 又 
是 在 带 GNU C 编 译 器 的 Linux 系 统 中 进行 的 。 


20.8 源 代 码 


本 市 解释 我 们 编写 的 数据 库 范 数 库 源 代码 ， 先 从 头 文 件 apue_db.h 
开始 。 函 数 库 源 代 码 以 及 调用 此 函数 库 的 所 有 应 用 程序 都 包 舍 这 一 头 
AC s 

从 此 处 开始 ， 实 例 程序 的 编排 方式 在 很 多 方面 与 前 面 的 实例 程序 
编排 有 所 不 同 。 首 先 ， 因 为 源 代码 较 长 ， 为 此 加 了 行 号 ， 这 使 得 通过 
行 号 联系 相应 的 源 代码 进行 讨论 更 加 方便 。 其 次 ， 对 源 代 码 的 说 明 紧 
随 相 关 源 代码 之 后 。 

这 种 风格 受到 John Lions 解 释 UNIX V6 操作 系统 源 代码 的 书 [Lions 
1977, 1996] 的 有 影响， 这 使 得 解释 说 明 大 量 源 代码 更 为 简易 。 

注意 ， 此 处 对 空白 行 不 编号 。 虽 然 某 些 工具 〈 如 pr(1)) 的 正常 操 
作 与 这 些 空 白 行 是 有 关 的 ， 但 是 我 们 对 它们 并 无 任何 兴趣 。 

1 #ifndef APUE DB H 

2 #define APUE DB H 

3 typedef void * DBHANDLE; 

4 DBHANDLE db open(const char *, int, ...); 

5 void db close(DBHANDLE;); 

6 char *db fetch(DBHANDLE, const char *); 

7 int db store(DBHANDLE, const char *, const char *, int); 

8 int db delete(DBHANDLE, const char *); 


9 void db rewind(DBHANDLE); 

10 char *db nextrec(DBHANDLE, char *); 

11 /* 

12 * Flags for db_store().13 */ 

14 #define DB_INSERT 1 /* insert new record only */ 

15 Zdefine DB. REPLACE 2 /* replace existing record */ 

16 ZdefineDB STORE 3 /* replace or insert */ 

17 /* 

18 * Implementation limits. 

19 */ 

20 #define IDXLEN MIN 6  /* key, sep, start, sep, length, \n */ 

21 #define IDXLEN. MAX 1024 /* arbitrary */ 

22 define DATLEN MIN 2  /* data byte, newline */ 

23 #define DATLEN MAX 1024 /* arbitrary */ 

24 #endif /* APUE DB H */ 

[17-3] 使 用 符号 _APUE_DB_H 以 保证 只 包括 该 头 文 件 一 次 。 
DBHANDLE 类 型 表示 对 数据 库 的 一 个 有 效 引 用 ， 用 于 隔离 应 用 程序 和 
数据 库 的 实现 细节 。 将 此 技术 与 标准 MO 库 向 应 用 程序 提供 FILE 结 构 相 
比较 ， 两 者 相似 。 

[4~10] 接着 ， 声 明了 数据 库 芳 数 库 公 有 函数 的 原型 。 因 为 使 用 函 
数 库 的 应 用 程序 包括 了 此 头 文 件 ， 所 以 这 里 不 再 声明 函数 库 私 有 函数 
的 原型 * 

[117-24] 定义 了 可 以 传送 给 db. store 范 数 的 合法 标志 。 其 后 是 实现 
的 基本 限制 。 如 果 硕 望 文 持 更 大 的 数据 库 ， 可 以 更 改 这 些 限制 。 

最 小 索引 记录 长 度 由 IDXLEN_MIN 指 定 。 这 表示 1 字 节 键 、1 字 节 
分 隔 符 、1 字 节 起 始 偏 移 量 ， 男 一 个 1 字 节 分 隔 符 、1 字 字 长 度 和 终止 换 


行 符 。 《回忆 图 20-2 中 索引 记录 的 格式 。) 一 条 索引 记录 通常 长 于 
IDXLEN_MIN 字 节 ， 这 只 是 最 小 长 度 。 

下 一 个 文件 是 db.c， 它 是 库 函 数 的 C 源 文件 。 为 简化 起 见 ， 将 所 有 
函数 都 放 在 一 个 文件 中 。 这 样 处 理 的 优点 是 只 要 将 私有 函数 声明 为 
static, WiP ATINE E REMER e 

1 #include "apue.h" 

2 #include "apue db.h" 

3 include <fcntl.h> /* open & db open flags */ 

4 #include <stdarg.h> 


5 #include <errno.h> 


6 #include <sys/uio.h> /* struct iovec */ 


7/* 

8 * Internal index file constants. 

9 * These are used to construct records in the 

10 * index file and data file. 

11 */ 

12 #define IDXLEN_SZ 4  /* index record length (ASCII 
chars) */ 

13 define SEP "! * separator char in index record */ 

14 #define SPACE '' * space character */ 

15 #define NEWLINE ^n /* newline character */ 

16 /* 


17 * The following definitions are for hash chains and free 

18 * list chain in the index file. 

19 */ 

20  £define PTR_SZ 7  f*size of ptr field in hash chain */ 
21 #define PTR MAX 999999 /* max file offset = 10**PTR, SZ - 1 */ 


22 #define NHASH, DEF 137 /* default hash table size */ 

23 #define FREE OFF O /* free list offset in index file */ 

24  #define HASH OFF PTR_SZ /* hash table offset in index 
file */ 

25 typedef unsigned long DBHASH; /* hash values */ 

26 typedef unsigned long COUNT; /* unsigned counter */ 

[17-6] [E FH] T — EE XA ES RUE FP BSEC, BEDARF P TR T 
apue.h ° 4%, apue.h 也 包括 车 干 标 准 头 文件 ， 包 括 <stdio.h> 和 
<unistd.h>。 因 为 db open KZE EH «stdarg.h» 4E SCHY n] 28 22 LER AC, 
所 以 程序 中 也 包括 了 <stdarg.h>。 

[7 一 26] 索引 记录 的 长 度 说 明 为 IDXLEN_SZ。 我 们 用 某 些 字符 

(如 冒号 、 换 行 符 ) 作为 数据 库 中 的 分 隔 符 。 当 删除 一 记录 时 ， 在 其 
中 全 部 填 入 空格 符 。 

其 中 一 些 定 义 为 常量 的 值 也 可 定义 为 变量 ， 只 是 会 使 实现 复 米 一 
些 。 例 如 ， 设 定 散 列表 的 大 小 为 137 记录 项 ， 也 许 更 好 的 方法 是 让 
db open 的 调用 者 根据 预期 的 数据 库 大 小 通过 参数 来 设 定 这 个 值 ， 然 后 
将 该 值 存在 索引 文件 的 最 前 面 。 

27 /* 

28 *Library's private representation of the database. 

29 */ 

30 typedef struct { 

31 int idxfd; /* fd for index file */ 

32 int  datfd; /* fd for data file */ 


33 char *idxbuf; /* malloc'ed buffer for index record */ 
34 char *datbuf; /* malloc'ed buffer for data record */ 
35 char *name; /* name db was opened under */ 


36 off t idxoff; /* offset in index file of index record */ 


37 /* key is at (idxoff + PTR SZ + 
IDXLEN SZ) */ 

38 size t idxlen; /* length of index record */ 

39 /* excludes IDXLEN SZ bytes at front of record */ 

40 /* includes newline at end of index record */ 

41 off t datoff; /* offset in data file of data record */ 

42 size t datlen; /* length of data record */ 

43 /* includes newline at end */ 

44 off t ptrval; /* contents of chain ptr in index record */ 

45 off t ptroff; /* chain ptr offset pointing to this idx record */ 

46 off t chainoff; /* offset of hash chain for this index record */ 

47 off t hashoff; /* offset in index file of hash table */ 

48 DBHASH nhash; /* current hash table size */ 

49 COUNT cnt delok; /* delete OK */ 

50 COUNT cnt delerr; /* delete error */ 

51 COUNT cnt fetchok; /* fetch OK */ 

52 COUNT cnt fetcherr; /* fetch error */ 


53 COUNT cnt nextrec; /* nextrec */ 

54 COUNT cnt stor1; /* store: DB. INSERT, no empty, 
appended */ 

55 COUNT cnt stor2; /* store: DB INSERT, found 
empty, reused */ 

56 COUNT cnt stor3; /* store: DB. REPLACE, diff len, 
appended */ 

57 COUNT cnt stor4; /* store: DB. REPLACE, same len, 


overwrote */ 


58 COUNT cnt storerr; /* store error */ 


59 } DB; 
[27~48] f£ DB 结构 中 记录 ee HH odo ° db open 


函数 返回 DB 结构 的 指针 DBHANDLE 值 。 这 个 指针 被 用 于 其 他 所 有 画 
ML, MARMARA ya Ae o 


因为 在 数据 库 中 以 ASCH 形式 存放 指针 和 长 度 ， 所 以 将 这 些 转换 


为 数字 值 ， 并 存放 在 DB 结构 中 。 也 存放 散 列表 长 度 ， 虽 然 一 般 而 言 ， 
文 是 定 长 的 ， 但 也 有 可 能 为 加 强 该 函数 库 ， 人 允许 调用 者 在 创建 数据 库 
时 指定 该 长 度 (见习 题 20.7) ° 


[49~ 59] DB 结构 的 最 后 10 个 字段 对 成 功 和 不 成 功 的 操作 进行 计 


数 。 如 果 想 要 分 析 数据 库 的 性 能 ， 则 可 编写 一 个 画 数 返回 这 些 统计 
值 。 但 目前 我 们 仅 保持 这 些 计数 器 ， 并 未 编写 此 种 画 数 。 


60 /* 

61 *Internal functions. 

62 */ 

63 static DB * db alloc(int); 

64 static void — db dodelete(DB *); 

65 static int db find and lock(DB *, const char *, int); 
66 static int db findfree(DB *, int, int); 

67 static void ^. db free(DB *); 

68 static DBHASH . db hash(DB *, const char *); 

69 static char * db readdat(DB *); 

70 static off t —. db readidx(DB *, off t); 

71 static off t ^ db readptr(DB *, off t); 

72 static void _db_writedat(DB *, const char *, off t, int); 
73 static void ^ db writeidx(DB *, const char *, off t, int, off t); 
74 static void ^ db writeptr(DB *, off t, off t); 

75 /* 


76 *Open or create a database. Same arguments as open(2). 
77 */ 

78 DBHANDLE 

79 db open(const char *pathname, int oflag, ...) 


80 { 

81 DB *db; 

82 int len, mode; 

83 size_t i; 

84 char asciiptr[PTR_SZ + 1], 

85 hash[(NHASH_DEF + 1) * PTR_SZ + 2]; 
86 /* +2 for newline and null */ 
87 struct stat statbuff; 

88 /* 

89 * Allocate a DB structure, and the buffers it needs. 

90 */ 


91 len = strlen(pathname); 

92 if ((db = _db_alloc(len)) == NULL) 

93 err_dump("db_open: _db_alloc error for DB"); 

[60~74] 选择 用 db_ 开头 来 命名 用 户 可 调用 〈 公 有) 的 所 有 函数 ， 
Hj db 开头 来 命名 内 部 (MA) KA o 2A ENTE ER RUE SC fF 
apue_db.h 中 声明 。 内 部 函数 声明 为 static， 所 以 只 有 同一 文件 中 的 其 他 
函数 才能 调用 它们 《该 文件 包含 函数 库 实现 ) 。 

[757-93] db_open 画 数 的 参数 与 open(2) 相 同 。 如 果 调 用 者 想 要 创建 
数据 库 文 件 ， 那 么 用 可 选择 的 第 三 个 参数 指定 文件 权限 。db_open 郴 数 
打开 索引 文件 和 数据 文件 ， 在 必要 时 初始 化 索引 文件 。 该 函数 调用 
db alloc 来 为 DB 结构 分 配 空间 ， 并 初始 化 此 结构 。 

94 db->nhash =NHASH_DEF;/* hash table size */ 


95 db->hashoff = HASH. OFF; /* offset in index file of hash 
table */ 


96 strcpy(db->name, pathname); 

97 strcat(db->name, ".idx"); 

98 if (oflag & O_CREAT) { 

99 va_list ap; 

100 va_start(ap, oflag); 

101 mode = va_arg(ap, int); 

102 va end(ap); 

103 /* 

104 * Open index file and data file. 
105 */ 


106 db->idxfd = open(db->name, oflag, mode); 
107 strcpy(db->name + len, ".dat"); 

108 db->datfd = open(db->name, oflag, mode); 
109 } else { 

110 /* 

111 * Open index file and data file. 

112 */ 

113 db->idxfd = open(db->name, oflag); 

114 strcpy(db->name + len, ".dat"); 

115 db->datfd = open(db->name, oflag); 

116 } 

117 if (db->idxfd < 0 || db->datfd < 0) { 

118 _db_free(db); 

119 return(NULL); 

120 } 


[94~97] 继续 初始 化 DB 结构 。 调 用 者 传 入 的 路 径 名 指定 数据 库 文 
件 名 的 前 缀 。 追 加 后 组 .idx 以 构成 数据 库 素 引文 件 的 名 字 。 

[98—-108] 如 有 果 调 用 者 想 要 创建 数据 库 文 件 ， 那 么 使 用 <stdarg.h> 中 
的 可 变 参数 函数 以 找到 可 选 的 第 三 个 参数 。 然 后 ， 使 用 open 创建 并 打 
开 索 引文 件 和 数据 文件 。 注 意 ， 数 据 文件 的 文件 名 以 索引 文件 同样 的 
前 组 开始 ， 但 后 组 为 .dat 。 

[109—116] 如 果 调 用 者 没有 指定 O_CREAT 标 志 ， 那 么 正在 打开 已 
有 的 数据 库 文件 。 此 时 ， 只 用 两 个 参数 调用 open 。 

[117—120] 如 果 在 打开 或 创建 任 一 数据 库 文件 时 出 错 ， 则 调用 
_db_free 清 除 DB 结 构 ， 人 然后 对 调用 者 返回 NULL。 如果 一 个 文件 open 成 
功 而 男 一 个 失败 ，_db_free 将 关闭 该 打开 文件 描述 符 。 我 们 很 快 就 会 见 
到 这 一 操作 。 


121 if ((oflag & (O CREAT | O_TRUNC)) == (O CREAT | 
O TRUNCO)) ( 

122 p 

123 * [f the database was created, we have to initialize 

124 * it. Write lock the entire file so that we can stat 

125 * it, check its size, and initialize it, atomically. 

126 */ 

127 if (writew_lock(db->idxfd, 0, SEEK_SET, 0) < 0) 

128 err dump("db open: writew lock error"); 

129 if (fstat(db->idxfd, &statbuff) « 0) 

130 err sys("db open: fstat error"); 

131 if (statbuff.st size == 0) { 

132 /* 

133 * We have to build a list of (NHASH_DEF + 1) 


chain 


134 * ptrs with a value of 0. The +1 is for the free 


135 * list pointer that precedes the hash table. 
136 =f 
137 sprintf(asciiptr, "%*d", PTR_SZ, 0); 


[121~ 130] 如 果 正 在 建立 数据 库 ， 则 必须 正确 地 加 锁 。 考 虑 两 个 
进程 试图 同时 建立 同一 个 数据 库 的 情况 。 第 一 个 进程 运行 到 调用 fstat， 
并 且 在 fstat 区 回 后 被 内 核 阻 守 。 

这 时 第 二 个 进程 调用 db_open， 发 现 索 引文 件 的 长 度 为 0， 然 后 初 

台 化 空闲 链表 和 散 列 链表 。 第 二 个 进程 继续 运行 ， 向 数据 库 中 写 入 了 
一 条 记录 。 这 时 第 二 个 进程 被 阻塞 ， 第 一 个 进程 在 调用 fstat 后 立刻 继续 
运行 ， 它 发 现 索 引文 件 的 长 度 为 0 (因为 第 一 个 进程 调用 fstat 在 前 ， 然 
后 第 二 个 进程 再 初始 化 索引 文件 ) ， 所 以 第 一 个 进程 重新 初始 化 空闲 
链表 和 散 列 链表 ， 第 二 个 进程 写 入 的 记录 束 补 抹 去 了 。 

避免 发 生 这 种 情况 的 方法 是 进行 加 锁 ， 为 此 可 以 使 用 14.3 和 中 的 
readw. lock ` writew_lock#un_lockiX3 N% ° 

[1317-137] 如 果 索 引文 件 的 长 度 是 0， 那 么 这 是 刚刚 被 创建 的 ， 所 
以 需要 初始 化 它 所 包含 的 空闲 列表 指针 和 散 列 链 指 针 。 注 意 ， 使 用 格 
式 字 符 串 %*d 将 数据 库 指 针 从 整 型 转换 为 ASCI 字 符 串 。 (在 
_db_writeidx 和 _db_writeptr 中 还 将 使 用 这 种 格式 字符 串 。) 这 一 格式 告 
诉 sprintf 取 PTR_SZ 参 数 ， 用 它 作 为 下 一 个 参数 的 最 小 字段 宽度 ， 在 此 
例 中 ， 它 是 0 (此 处 ， 因 为 正在 创建 一 数据 库 ， 所 以 将 指针 初始 化 为 
0) 。 其 作用 是 强迫 创建 的 字符 串 至 少 包 售 PTR_SZ 个 字符 (在 左边 用 
空格 充填 ) 。 在 _db_writeidx 和 _db_writeptr 中 ， 将 传送 一 个 非 0 指 针 
值 ， 但 是 首先 将 验证 指针 值 不 大 于 PTR_MAX， 以 保证 写 入 数据 库 的 
指针 字符 串 恰 好 为 PTR_SZ(7) 个 字符 。 

138 hash[0] = 0; 

139 for (i = 0; i < NHASH DEF + 1; i++) 


140 strcat(hash, asciiptr); 


141 strcat(hash, ^n"); 

142 i 7 strlen(hash); 

143 if (write(db->idxfd, hash, i) != i) 

144 err dump("db open: index file init write 
error"); 

145 } 

146 if (un_lock(db->idxfd, 0, SEEK_SET, 0) < 0) 

147 err_dump("db_open: un_lock error"); 

148 } 

149 db_rewind(db); 

150 return(db); 

151 } 

152 /* 

153 * Allocate & initialize a DB structure and its buffers. 

154 */ 


155 static DB * 
156 db alloc(int namelen) 


157 { 

158 DB *db; 

159 /* 

160 * Use calloc, to initialize the structure to zero. 

161 */ 

162 if ((db = calloc(1, sizeof(DB))) == NULL) 

163 err dump(" db alloc: calloc error for DB"); 

164 db->idxfd = db->datfd = -1; /* descriptors */ 


165 [= 


166 * Allocate room for the name. 

167 * +5 for ".idx" or ".dat" plus null at end. 

168 */ 

169 if ((db->name = malloc(namelen + 5)) == NULL) 

170 err dump(" db alloc: malloc error for name"); 

[138~ 151] 继续 初始 化 新 创建 的 数据 库 。 构 造 散 列表 ， 将 它 写 到 
索引 文件 中 。 然 后 ， 解 锁 索 引文 件 ， 重 置 数据 库 文件 指 守 ， 返 回 DB 结 
构 指针 作为 句柄 ， 以 便 调 用 者 以 后 用 于 其 他 数据 库 函 数 。 

[152~164] db_open 调 用 函数 _db_alloc 为 DB 结构 分 配 空间 ， 包 括 一 
个 索引 缓冲 区 和 一 个 数据 缓冲 区 。 用 calloc 分 配 存储 区 来 存放 DB 结 
构 ， 并 将 该 存储 区 各 存储 单元 全 部 初始 化 为 0。 这 产生 了 一 个 副作用 ， 
也 就 是 将 数据 库 文件 描述 符 也 设置 为 0， 为 此 需 将 它们 重新 设置 为 -1， 
表示 它们 至 此 还 不 是 有 效 的 。 

[165-170] 分 配 空间 以 存放 数据 库 索 引文 件 和 数据 文件 的 名 字 。 
如 db open 中 所 说 明 的 那样 ， 更改 它 们 的 名 字 后 级 以 便 引 用 索引 文件 
或 数据 文件 。 

171 /* 

172 * Allocate an index buffer and a data buffer. 

173 * +2 for newline and null at end. 

174 */ 

175 if ((db->idxbuf = malloc(IDXLEN MAX + 2)) == NULL) 

176 err dump(" db alloc: malloc error for index buffer"); 

177 if ((db->datbuf = malloc(DATLEN MAX + 2)) == NULL) 

178 err dump(" db alloc: malloc error for data buffer"); 

179 return(db); 

180 } 

181 /* 


182  * Relinquish access to the database. 

183  */ 

184 void 

185 db close(DBHANDLE h) 

186 { 

187 db free((DB *)h); /* closes fds, free buffers & struct 
*/ 

188 } 

189 /* 

190 * Free up a DB structure, and all the malloc'ed buffers it 

191 * may point to. Also close the file descriptors if still open. 

192 */ 

193 static void 

194 _db_free(DB *db) 


195 { 

196 if (db->idxfd >= 0) 
197 close(db->idxfd); 
198 if (db->datfd >= 0) 
199 close(db->datfd); 


[171~180] 为 索引 文件 和 数据 文件 的 缓冲 区 分 配 空间 。 索 引 缓 冲 
区 和 数据 缓冲 区 的 大 小 在 apue_db.h 中 定义 。 可 以 通过 让 这 些 缓冲 区 按 
需要 动态 扩张 来 增强 数据 库 函 数 库 。 其 方法 可 以 是 记录 这 两 个 缓冲 区 
的 大 小 ， 然 后 在 需要 更 大 的 缓冲 区 时 调用 realloc。 最 后 ， 返 回 指 同 已 分 
配 到 的 DB 结 构 的 指针 。 

[1817-188] db_close 芳 数 只 是 一 个 包 锋 ， 它 将 数据 库 句 栅 强 制 类 型 
转换 为 DB 结构 的 指针 ， 将 RUN db_free K žr, FIX AERC 
以 及 DB 结构 。 


[189--199] db_open 在 打开 索引 文件 和 数据 文件 时 如 果 发 生 错 误 ， 
会 调用 _db free 函数 释放 资源 。 应 用 程序 在 结束 对 数据 库 的 使 用 后 ， 
db_close 也 会 调用 _db_free。 如 来 数据 库 索 引文 件 的 文件 接 述 人 牺 有效， 
那么 关闭 该 文件 。 对 数据 文件 描述 符 也 进行 同样 处 理 。 (回忆 在 
_db_ alloc 中 分 配 一 个 新 的 DB 结构 时 ， 将 每 个 文件 描述 符 都 初始 化 为 
-1。 如 来 不 能 打开 两 个 数据 库 文件 中 的 一 个 ， 相 应 文件 搬 述 符 仍 为 
-1， 也 就 是 无 需 关 闭 它 。) 

200 if (db->idxbuf != NULL) 


201 free(db->idxbuf); 
202 if (db->datbuf != NULL) 
203 free(db->datbuf); 
204 if (db->name != NULL) 
205 free(db->name); 
206 free(db); 

207 } 

208 /* 


209 * Fetch a record. Return a pointer to the null-terminated data. 
210 */ 


211 char * 

212 db_fetch(DBHANDLE h, const char *key) 
213 { 

214 DB *db = h; 


215 char *ptr; 

216 if ( db find and lock(db, key, 0) « 0) { 

217 ptr = NULL; /* error, record not found */ 
218 db->cnt_fetcherr++; 

219 } else { 


220 ptr = db readdat(db);  /* return pointer to data */ 


221 db->cnt_fetchok++; 

222 } 

223 pt 

224 * Unlock the hash chain that. db find and lock locked. 
225 */ 

226 if (un lock(db-^idxfd, db->chainoff, SEEK. SET, 1) < 0) 
227 err dump("db fetch: un lock error"); 


228 return(ptr); 

229 } 

[200—207] 接着 ， 释 放 动 态 分 配 的 缓冲 区 。 可 以 安全 地 将 一 个 空 
指针 传递 给 free 画 数 ， 这 样 也 就 无 需 事先 检查 每 个 缓冲 区 指针 的 值 ， 
但 是 我 们 认为 只 释放 已 分 配 的 对 象 是 一 种 较 好 的 编程 风格 。 (并 非 所 
有 释放 程序 都 像 free 那样 容忍 差错 。) 最 后 ， 释 放 DB 结 构 占 用 的 存储 
区 。 

[208~ 218] 函数 db _fetch 根 据 给 定 的 键 来 读 取 一 条 记录 。 它 调用 
db find_and_lock 在 数据 库 中 查找 记 录 。 帮 不 能 找到 该 记录 ， 则 将 返回 
值 (ptr) 设置 为 NULL ， 将 不 成 功 的 记录 搜索 计数 器 值 加 1。 因 为 从 
-db find and lock 返回 时 ， 数 据 库 索 引文 件 是 加 锁 的 ， 所 以 抑 要 解 
WB, 7S RB ° 

[219-229] 如 果 找 到 了 记录 ， 调 用 _db_readdat 读 相应 的 数据 记录 ， 
并 将 成 功 记录 搜索 计数 絮 值 加 1。 在 返回 前 ， 调 用 un_lock 对 索引 文件 解 
锁 。 然 后 ， 返 回 所 找到 记录 的 指针 (如 果 没 有 找到 所 需 记录 ， 则 返回 
NULL) 

230 /* 

231 * Find the specified record. Called by db delete, db fetch, 

232 * and db store. Returns with the hash chain locked.233 */ 


234 static int 
235 db find and lock(DB *db, const char *key, int writelock)236 { 


237 
238 
239 
240 
241 
242 
243 
244 
245 
246 
247 
248 
249 
250 
251 
1) « 0) 
252 
error"); 
253 
254 
1) « 0) 
255 
error"); 
256 
257 


off t offset, nextoffset; 
[* 
* Calculate the hash value for this key, then calculate the 
* byte offset of corresponding chain ptr in hash table. 
* This is where our search starts. First we calculate the 
* offset in the hash table for this key. 
*/ 
db->chainoff = ( db hash(db, key) * PTR_SZ) + db->hashoff; 
db->ptroff = db->chainoff; 
f* 
* We lock the hash chain here. The caller must unlock it 
* when done. Note we lock and unlock only the first byte. 
20, 
if (writelock) { 
if (writew_lock(db->idxfd, db->chainoff, SEEK. SET, 


err dump(" db find and lock: writew lock 


} else { 
if (readw_lock(db->idxfd, db->chainoff, SEEK_SET, 


err dump(" db find and lock: readw_lock 


/* 


258 * Get the offset in the index file of first record 

259 * on the hash chain (can be 0). 

260 T 

261 offset = db readptr(db, db->ptroff); 

[230—237] db find and lock 函数 在 函数 库 内 部 用 于 按 给 定 的 刍 
查找 记录 。 在 搜索 记录 时 ， 如 果 想 在 索引 文件 上 加 一 把 写 锁 ， 则 将 
writelock 人 参数 设置 为 非 0 值 。 如 宁 将 writelock 参 数 设置 为 0， 则 在 搜索 记 
孙 时 ， 在 索引 文件 上 加 读 锁 。 

[238—-256] 在 db find and lock 中 准备 遍历 散 列 链 。 将 键 转 换 为 
散 列 值 ， 用 其 计算 在 文件 中 相应 散 列 链 的 起 始 地 址 (chainoff) ° Ek 
历 散 列 链 前 ， 等 待 获 得 锁 。 注 意 ， 只 锁 该 散 列 链 开 始 处 的 第 1 个 字 
节 。 这 种 方式 允许 多 个 进程 同时 搜索 不 同 的 散 列 链 ， 因 此 增加 了 并 发 
性 。 


[257-261] 调用 _db_readptr 读 散 列 链 中 的 第 一 个 指针 。 如 末 该 画 数 
返回 0， 则 该 散 列 链 为 空 。 
262 while (offset != 0) { 


263 nextoffset = db readidx(db, offset); 

264 if (strcmp(db-»idxbuf, key) == 0) 

265 break; /* found a match */ 

266 db->ptroff = offset; /* offset of this (unequal) record */ 
267 offset = nextoffset; /* next one to compare */ 

268 } 

269 /* 

270 * offset == 0 on error (record not found). 

271 */ 


272 return(offset == 0 ? -1 : 0); 
273 } 


274 /* 

275 * Calculate the hash value for a key. 
276 */ 

277 static DBHASH 

278 db hash(DB *db, const char *key) 


279 { 

280 DBHASH hval = 0; 

281 char C; 

282 int 1; 

283 for (i = 1; (c = *key++) != 0; i++) 

284 hval += c * i; /* ascii char times its 1-based index 
= 

285 return(hval % db->nhash); 

286 } 

[262 ~ 268] while Hath ia J AN) BE PA BE RRS Se, FFE 
键 。 调 用 函数 _db_readidx 读 取 每 条 索引 记录 。 它 将 当前 记录 的 键 填 入 


DB 结构 中 的 idxbuf 字段 。 如 果 _db_readidx 返 回 0， 则 已 到 达 散 列 链 的 
最 后 一 记录 项 。 

[269—273] 如 果 在 循环 后 ，offset 为 0， 说 明 已 达到 散 列 链 末 端 而 
旦 没有 找到 匹配 键 ， 于 是 返回 -1。 否则 ， 找 到 了 匹配 记录 (用 break 语 
句 退 出 了 循环 ) ， 所 以 返回 0 表示 成 功 。 此 时 ，ptroff 字 段 包 含 前 一 索引 
记录 的 地 址 ，datoff 包 含 数据 记录 的 地 址 ， datlen 是 数据 记录 的 长 度 。 
当 沿 着 散 列 链 进 行 亿 历时 ， 必 须 始终 保存 当前 索引 记录 的 前 一 条 索引 
记录 ， 其 中 有 一 个 指针 指 癌 当前 索引 记录 。 这 样 做 在 删除 一 条 记录 时 
很 有 用 ， 因 为 必须 修改 当前 索引 记录 的 前 一 条 记录 的 链 指 针 以 删除 当 
前 记录 。 


[274—286] _db_hash 根 据 给 定 的 键 计 算 散 列 值 。 它 将 键 中 的 每 一 个 
ASCI 字 符 乘 以 这 个 字符 在 字符 串 中 以 1 开始 的 索引 号 ， 将 这 些 结果 加 
起 来 ， 除 以 散 列 表 记 录 项 数 ， 将 余数 作为 这 个 键 的 散 列 值 。 回 忆 散 列 
表 记 杂项 数 是 137， 它 是 一 个 素数 ， 按 Knuth[1998] RAIE i Be 
提供 民 好 的 分 布 特性 。 

287 /* 

288 * Read a chain ptr field from anywhere in the index file: 


289 * the free list pointer, a hash table chain ptr, or an 
290 * index record chain ptr. 

291 */ 

292 static off t 

293 db readptr(DB *db, off t offset) 

294 { 

295 char asciiptr| PTR_SZ + 1]; 

296 if (lseek(db->idxfd, offset, SEEK, SET) == -1) 


297 err dump(" db readptr: Iseek error to ptr field"); 
298 if (read(db->idxfd, asciiptr, PTR. SZ) != PTR, SZ) 
299 err dump(" db readptr: read error of ptr field"); 
300 asciiptr[ PTR_SZ] = 0; /* null terminate */ 
301 return(atol(asciiptr)); 

302 } 

303 /* 


304 * Read the next index record. We start at the specified offset 
305 * in the index file. We read the index record into db->idxbuf 
306 * and replace the separators with null bytes. If all is OK we 
307 * set db->datoff and db->datlen to the offset and length of the 


308 * corresponding data record in the data file. 


309 */ 
310 static off t 
311. db readidx(DB *db, off t offset) 


312 1 

313 ssize t i 

314 char *ptr1, *ptr2; 

315 char asciiptr[PTR. SZ + 1], 
asciilen[IDXLEN_SZ + 1]; 

316 struct iovec iov[2]; 


[287—302] _db_readptr 函 数 读 取 以 下 3 种 不 同 链表 指针 中 的 任意 一 

种 : (a) 索引 文件 最 开始 处 指向 空闲 链表 中 第 一 个 索引 记录 的 指针 , 

(b) 散 列表 中 指向 散 列 链 的 第 一 条 索引 记录 的 指针 ， (c) 存放 在 每 
条 索引 记录 开始 处 、 指 向 下 一 条 记录 的 指针 〈 这 里 的 索引 记录 既 可 以 
处 于 一 条 散 列 链表 中 ， 也 可 以 处 于 空间 链表 中 ) 。 返 回 前 ， 将 指针 从 
ASCII 形 式 转换 为 长 整 型 。 此 函数 不 进行 任何 加 锁 操 作 ， 所 以 其 调用 者 
应 事先 做 好 必要 的 加 锁 。 

[303~316] _db_readidx 芳 数 用 于 从 索引 文件 的 指定 偏 移 量 处 读 取 
索引 记录 “。 如 果 成 功 ， 该 函数 将 返回 链表 中 下 一 条 记录 的 偏 移 量 。 该 
函数 还 填充 DB 结构 的 许多 字段 : idxoff 包 含 索引 文件 中 当前 记录 的 偏 
移 量 ，ptrval 包 含 在 散 列 链表 中 下 一 个 索引 项 的 偏 移 量 ，idxlen 包 含 当 前 
索引 记录 的 长 度 ，idxbuf 包 含 实际 索引 记录 ， datoff 包 含 数据 文件 中 该 
记录 的 偏 移 量 ，datlen 包 含 该 数据 记录 的 长 度 。 


317 /* 

318 * Position index file and record the offset. db nextrec 
319 * calls us with offset==0, meaning read from current offset. 
320 * We still need to call Iseek to record the current offset. 


321 */ 


IDXLEN_SZ) { 


wd 


322 
323 
324 
325 
326 
327 
328 
329 
330 
331 
332 
333 
334 


335 


if ((db->idxoff = lseek(db->idxfd, offset, 
offset == 0? SEEK, CUR : SEEK SET)) == -1) 
err dump(" db readidx: Iseek error"); 
f* 
* Read the ascii chain ptr and the ascii length at 
* the front of the index record. This tells us the 
* remaining size of the index record. 
*/ 
iov[0].iov_base = asciiptr; 
iov[0].iov_len =PTR_SZ; 
iov[1].iov_base = asciilen; 
iov[1]iov len =IDXLEN_SZ; 
if (i = readv(db->idxfd, &iov[0], 2)) != PTR SZ + 


if (i == 0 && offset == 0) 
return(-1); /* EOF for db nextrec */ 


err dump(" db readidx: readv error of index record"); 


j 

/* 

* This is our return value; always >= 0. 

e 

asciiptr[PTR, SZ] = 0; /* null terminate */ 


db->ptrval =  toll(asciiptr); /* offset of next key in chain 


asciilen[IDXLEN_SZ] = 0; /* null terminate */ 
if ((db->idxlen = atoi(asciilen)) < IDXLEN_MIN || 
db->idxlen > IDXLEN_MAX) 


347 err dump(" db readidx: invalid length"); 

[317—324] FA eS NETRA 9 OC ns & ° EDB 
HRT ne EE. J EB E Y FSB Oh SE R 
(设置 offset 为 0) ， 仍 需要 调用 lseek 以 确定 当前 偏 移 量 。 因 为 在 索引 文 
件 中 ， 索 引 记 隶 决 不 会 存放 在 仿 移 量 为 0 处 ， 所 以 可 以 放心 地 使 用 0 表 
TINS S Bl AS BBP TSE” o 

[325~338] ee PA RO bu 
下 一 索引 记录 的 链 指针 和 该 索引 记录 余下 部 分 的 长 度 〈 余 下 部 
长 的 ) 。 

[339-347] 将 下 一 记录 的 偶 移 量 转换 为 整 型 ， 并 存放 到 ptrval 字 段 
中 〈 这 将 被 用 作 此 函数 的 返回 值 ) 。 然 后 将 索引 记录 的 长 度 转 换 为 整 
型 ， 并 存放 到 idxlen 字 段 中 。 


348 p 

349 * Now read the actual index record. We read it into the 
key 

350 * buffer that we malloced when we opened the database. 

351 gl 

352 if ((i = read(db->idxfd, db->idxbuf, db->idxlen)) != db- 
>idxlen) 

353 err dump(" db readidx: read error of index record"); 

354 if (db->idxbuf[db->idxlen-1] != NEWLINE) /* sanity 
check */ 

355 err_dump("_db_readidx: missing newline"); 

356 db->idxbuf[db->idxlen-1] = 0; /* replace newline 
with null */ 

357 /* 


358 * Find the separators in the index record. 


359 */ 


360 if ((ptr1 = strchr(db->idxbuf, SEP)) == NULL) 

361 err dump(" db readidx: missing first separator"); 

362 *ptrl++ = 0; /* replace SEP 
with null */ 

363 if ((ptr2 = strchr(ptr1, SEP)) == NULL) 

364 err dump(" db readidx: missing second separator"); 

365 *ptr2++ = 0; /* replace SEP 
with null */ 

366 if (strchr(ptr2, SEP) != NULL) 

367 err_dump("_db_readidx: too many separators"); 

368 /* 

369 * Get the starting offset and length of the data record. 

370 2 

371 if ((db->datoff = atol(ptr1)) « 0) 

372 err dump(" db readidx: starting offset « 0"); 

373 if ((db->datlen = atol(ptr2) <= 0 || db->datlen > 
DATLEN_MAX) 

374 err_dump("_db_readidx: invalid length"); 

375 return(db->ptrval); /* return offset of next key 
in chain */ 

376 } 


[348—356] 将 索引 记录 的 变 长 部 分 读 入 DB 结构 中 的 idxbuf 字 段 。 
该 记录 应 以 换行 符 结尾 。 

用 null 字 符 代 替换 行 符 。 如 果 索 引文 件 已 遭 破 坏 ， 那 么 调用 
err_dump 函 数 终止 core 文 件 。 


[357--367] 将 索引 记录 划分 成 3 个 字段 : 键 、 对 应 数据 记录 的 偏 
移 量 和 数据 记录 的 长 度 。 

strchr 芳 数 在 给 定 字 人 符 串 中 找到 第 一 个 指定 了 字符。 这里， 我 们 要 寻 
找 的 是 记录 中 分 隔 字段 的 字符 (SEP， 此 处 定义 为 冒号 ) 。 

[368-376] 将 数据 记录 偏 移 量 和 数据 记录 长 度 转换 为 整 型 ， 并 将 
它们 存放 在 DB 结构 中 。 然 后 ， 返 回 在 散 列 链 中 下 一 条 记录 的 侦 移 量 。 
注意 ， 我 们 并 不 读数 据 记 录 ， 这 由 调用 者 自己 完成 。 例 如 ， 在 db_fetch 
中 ,在 db find_and_lock 按 键 找到 索引 记录 前 是 不 读 取 数 据 记 录 的 。 

377 /* 

378 * Read the current data record into the data buffer. 


379 * Return a pointer to the null-terminated data buffer. 
380 */ 

381 static char * 

382 db readdat(DB *db) 


383 { 

384 if (lseek(db->datfd, db->datoff, SEEK. SET) == -1) 

385 err dump(" db readdat: Iseek error"); 

386 if (read(db->datfd, db->datbuf, db->datlen) != db->datlen) 

387 err dump(" db readdat: read error"); 

388 if (db->datbuf[db->datlen-1] != NEWLINE)  /* sanity check 
+7 

389 err dump(" db readdat: missing newline"); 

390 db->datbuf[db->datlen-1] = 0; /* replace newline with null */ 

391 return(db->datbuf); /* return pointer to data record */ 

392 } 

393 /* 


394 * Delete the specified record. 


395 */ 


396 int 

397 db delete(DBHANDLE h, const char *key)398 1 

399 DB *db - h; 

400 int rc = 0; /* assume record will be found 
P 

401 if ( db find and lock(db, key, 1) == 0) { 

402 _db_dodelete(db); 

403 db->cnt_delok++; 

404 } else { 

405 IC = -1; /* not found */ 

406 db->cnt_delerr++; 

407 } 

408 if (un. lock(db-^idxfd, db->chainoff, SEEK. SET, 1) < 0) 

409 err dump("db delete: un lock error"); 

410 return(rc); 

411 } 


[377 ~392] 在 datoff 和 datlen 已 经 被 正确 初始 化 后 ，_db_readdat 函 数 
将 数据 记录 的 内 容 读 入 DB 结构 中 的 datbuf 字 段 指 向 的 缓冲 区 。 

[393~411] db_delete 画 数 用 于 删除 与 给 定 键 匹 配 的 一 条 记录 。 使 用 
_db_find_and_lock 来 判断 在 数据 库 中 该 记录 是 否 存在 。 如 果 存 在 ， 则 调 
用 _db_dodelete 画 数 执行 删除 该 记 杂 的 操作 。_db_find_and_lock 的 第 三 
个 参数 控制 对 散 列 链 是 加 读 锁 还 是 写 锁 。 此 处 ， 因 为 可 能 执行 更 改 该 
链表 的 操作 ， 所 以 要 加 一 把 写 锁 。_db_find_and_lock 返回 时 ， 这 把 锁 
仍旧 存在 ， 为 此 不 管 是 否 找 到 了 所 需 的 记录 ， 都 需要 解除 这 把 锁 。 

412 /* 

413 * Delete the current record specified by the DB structure. 


414 * This function is called by db delete and db store, after 
415 * the record has been located by db find and lock.416 */ 
417 static void 

418. db dodelete(DB *db)419 { 


420 
421 
422 
423 
424 
425 
426 
427 
428 
429 
430 
431 
432 
433 
434 
435 
436 
437 
438 
439 
440 


int 1; 

char *ptr; 

off t freeptr, saveptr; 

L 

* Set data buffer and key to all blanks. 
*/ 


for (ptr = db->datbuf, i = 0; i < db->datlen - 1; i++) 
*ptr++ = SPACE; 

*ptr -0; /* null terminate for db writedat */ 

ptr = db->idxbuf; 

while (*ptr) 
*ptr++ = SPACE; 

/* 

* We have to lock the free list. 

"y 

if (writew_lock(db->idxfd, FREE OFF, SEEK, SET, 1) < 0) 
err dump(" db dodelete: writew lock error"); 

pe 

* Write the data record with all blanks. 

*/ 

_db_writedat(db, db->datbuf, db->datoff, SEEK_SET); 


[412~431] db dodelete 函数 执行 从 数据 库 中 删除 一 条 记录 的 所 有 


操作 。 


(该 函数 也 可 以 由 db_store 调 用 。) 此 函数 的 大 部 分 工作 仅仅 是 


更 新 空间 链表 以 及 与 键 对 应 的 散 列 链 。 当 一 条 记录 被 删除 后 ， 将 其 键 
和 数据 记录 设 为 空 。 本 章 后 面 将 提 到 的 函数 db_nextrec 要 用 到 这 一 点 。 

[432-440] 调用 writew_lock Xf 23 A REFS IN SL, IME RED LEP 
进程 同时 删除 不 同 链表 上 的 记录 时 产生 相互 影响 ， 因 为 要 将 被 删除 的 
记录 添加 到 空闲 链表 中 ， 这 将 改变 空 采 链表 指针 ， 而 一 次 只 能 有 一 个 
进程 能 这 样 做 。 

调用 函数 _db_writedat 清 空 数 据 记 录 。 这 时 _db_writedat 并 不 对 数据 
文件 加 写 锁 ， 这 是 因为 db_delete 对 这 条 记录 的 散 列 链 已 经 加 了 写 锁 ， 
这 保证 不 会 再 有 其 他 进程 能 够 恋 、 写 这 条 记录 。 


441 /* 


442 
443 
444 
445 
446 
447 
448 
449 
450 
451 
452 
453 
454 
455 
456 
457 
freeptr); 


* Read the free list pointer. Its value becomes the 

* chain ptr field of the deleted index record. This means 
* the deleted record becomes the head of the free list. 

*/ 

freeptr = _db_readptr(db, FREE_OFF); 
/* 

* Save the contents of index record chain ptr, 

* before it's rewritten by _db_writeidx. 

*/ 

saveptr = db->ptrval; 

L 

* Rewrite the index record. This also rewrites the length 
* of the index record, the data offset, and the data length, 
* none of which has changed, but that's OK. 

*/ 

_db_writeidx(db, db->idxbuf, db->idxoff, SEEK_SET, 


458 pr 


459 * Write the new free list pointer. 

460 */ 

461 _db_writeptr(db, FREE_OFF, db->idxoff); 

462 he 

463 * Rewrite the chain ptr that pointed to this record being 

464 * deleted. Recall that _db_find_and_lock sets db->ptroff 
to 

465 * point to this chain ptr. We set this chain ptr to the 

466 * contents of the deleted record's chain ptr, saveptr. 

467 "7 

468 - db writeptr(db, db->ptroff, saveptr); 

469 if (un lock(db-^idxfd, FREE OFF, SEEK. SET, 1) < 0) 

470 err dump(" db dodelete: un lock error"); 

471 } 


[441-461] 读 空 闲 链表 指针 ， 接 着 修改 索引 记录 。 让 这 条 记录 的 
下 一 条 记录 指针 指向 空闲 链表 的 第 一 条 记录 CURSE RE ZS, M 
这 个 新 的 链表 指针 置 为 0) 。 清 除 键 之 后 用 正 被 删除 索引 记录 的 偏 移 量 
更 新 空 几 链表 指针 ， 也 就 是 使 其 指向 当前 删除 的 这 条 记录 。 这 意味 着 
空 几 链表 的 处 理 基于 后 进 先 出 《虽然 是 以 首次 适应 算法 来 删除 空 亲 链 
表 项 ) ， 也 就 是 说 被 删除 的 记录 都 被 添加 到 空间 链表 头 部 。 

没有 为 每 个 文件 分 别 设置 空 几 链表。 将 一 个 删除 的 索引 记录 添加 
到 空 内 链表 时 ， 该 罕 引 记 孙 仍 指 癌 已 删除 的 数据 记录 。 当 然 还 有 更 好 
的 处 理 方法 ， 但 复杂 性 会 增加 。[462 一 471] 修改 散 列 链 中 前 一 条 记录 
的 指针 ， 使 其 指向 正 删 除 记录 之 后 的 记录 ， 这 样 束 从 散 列 链 中 移 除 了 
要 删除 的 记录 。 最 后 对 空闲 链表 解锁 。770 

472 /* 


473 * Write a data record. Called by db dodelete (to write 

474 * the record with blanks) and db store.475 */ 

476 static void 

477 db writedat(DB  *db, const char *data, off t offset, int 


whence)478 1 
479 
480 
481 
482 
483 
484 
485 
486 

file */ 
487 
488 
489 
490 
491 
492 
493 
494 
495 
496 
497 
498 
499 


struct iovec iov[2]; 
static char newline - NEWLINE; 
/* 


* If we're appending, we have to lock before doing the lseek 
* and write to make the two an atomic operation. If we're 
* overwriting an existing record, we don't have to lock. 

*/ 

if (whence == SEEK_END) /* we're appending, lock entire 


if (writew_lock(db->datfd, 0, SEEK_SET, 0) < 0) 
err dump(" db writedat: writew lock error"); 
if ((db->datoff = lseek(db->datfd, offset, whence)) == -1) 
err dump(" db writedat: Iseek error"); 
db->datlen = strlen(data) + 1; /* datlen includes newline */ 
iov[0].iov. base = (char *) data; 
iov[0].iov len = db->datlen - 1; 
iov[1].iov. base = &newline; 
iov[1]iov len -1; 
if (writev(db->datfd, &iov[0], 2) != db->datlen) 
err dump(" db writedat: writev error of data record"); 
if (whence == SEEK. END) 
if (un_lock(db->datfd, 0, SEEK_SET, 0) < 0) 


500 err dump(" db writedat: un lock error"); 

501 } 

[4727-491] 调用 函数 _db_writedat 写 一 个 数据 记录 。 当 删除 一 记录 
时 ， 调 用 函数 _db_writedat 清空 数据 记录 ; 这 时 _db_writedat 并 不 对 数 
据 文 件 加 写 锁 ， 因 为 db_delete 对 这 条 记录 的 散 列 链 已 经 加 了 写 锁 ， 这 
保证 不 会 再 有 其 他 进程 能 够 恋 、 写 这 条 记录 。 在 本 市 稍 后 处 说 明 
db_store 芳 数 时 ， 会 允 到 _db_writedat 芳 数 追 加 写 数 据 文件 的 情况 ， 此 时 
就 必需 对 该 文件 加 锁 。 

定位 到 要 写 数 据 记 录 的 位 置 。 要 写 的 字 节 数 是 记录 长 度 加 1 个 字 
方 ， 这 1 个 字 节 是 表示 记录 终止 的 换行 任 。 

[4927-501] 设置 iovec 数 组 ， 调 用 writev 写 数据 记录 和 换行 符 。 不 能 
想当然 地 认为 调用 者 缓冲 区 的 尾 端 有 衬 间 可 以 追加 换行 符 ， 所 以 应 该 
将 换行 符 写 入 另 一 个 缓冲 区 ， 然 后 再 从 该 缓冲 区 写 至 数据 记录 。 如 采 
正在 对 文件 妃 加 一 条 记录 ， 那 么 就 释放 早先 获得 的 锁 。 

502 /* 

503 * Write an index record. db writedat is called before 


504 * this function to set the datoff and datlen fields in the 


505 * DB structure, which we need to write the index record. 
506 */ 

507 static void 

508 db writeidx(DB *db, const char *key, 


509 off t offset, int whence, off t ptrval) 

511 struct iovec iov[2]; 

512 char asciiptrlen[PTR. SZ + IDXLEN SZ + 1]; 
513 int len; 

510 { 


514 if ((db->ptrval = ptrval) < 0 || ptrval > PTR. MAX) 


515 err quit(" db writeidx: invalid ptr: 96d", ptrval); 


516 sprintf(db->idxbuf, "%s%c%lld%c%ld\n"", key, SEP, 

517 (long long)db->datoff, SEP, (long)db->datlen); 

518 len = strlen(db->idxbuf); 

519 if (len < IDXLEN_MIN || len > IDXLEN_MAX) 

520 err_dump("_db_writeidx: invalid length"); 

521 sprintf(asciiptrlen, "%*lld%*d", PTR_SZ, (long long)ptrval, 

522 IDXLEN SZ, len); 

523 /* 

524 * [f we're appending, we have to lock before doing the 
Iseek 

525 * and write to make the two an atomic operation. If we’re 

526 * overwriting an existing record, we don’t have to lock. 

527 

528 if (whence == SEEK_END) /* we’re appending */ 

529 if (writew_lock(db->idxfd,  ((db- 
>nhash+1)*PTR_SZ)+1, 

530 SEEK_SET, 0) < 0) 

531 err dump(" db writeidx: writew lock error"); 


[502-522] 调用 _db_writeidx 函 数 写 一 条 索引 记录 。 在 验证 散 列 链 
中 下 一 个 指针 有 效 后 ， 创 建 索 引 记 录 ， 并 将 它 的 后 半 部 分 存放 到 idxbuf 
中 。 需 要 索引 记录 这 一 部 分 的 长 度 以 创建 该 记录 的 前 半 部 分 ， 而 前 半 
部 分 被 存放 到 局 部 变量 asciiptrlen 中 。 

注意 ， 使 用 强制 类 型 转换 使 得 sprintf 语 句 的 参数 的 长 度 与 格式 说 明 
中 相 匹 配 ， 这 样 做 是 因为 of_t 和 size_t 数 据 类 型 的 长 度 因 平台 不 同 而 不 
同 。32 位 系统 也 能 提供 64 位 文件 偏 移 量 ， 所 以 不 能 假定 off_t 数 据 类 型 
的 长 度 。 


[523-531] fll. db writedat 一 样 ， 只 有 在 追加 新 索引 记录 时 这 一 函 
数 才 需要 加 锁 。 

_db_dodelete 调 用 此 函数 是 为 了 重 写 一 条 已 有 的 索引 记录 。 在 这 种 
情况 下 ， 调 用 者 已 经 在 散 列 链 上 加 了 写 锁 ， 所 以 不 再 需要 加 另外 的 


S) ° 

532 /* 

533 * Position the index file and record the offset. 

534 */ 

535 if ((db->idxoff = lseek(db->idxfd, offset, whence)) == -1) 

536 err_dump("_db_writeidx: lseek error"); 

537 iov[0].iov_base = asciiptrlen; 

538 iov[0].iov len = PTR_SZ + IDXLEN_SZ; 

539 iov[1].iov_base = db->idxbuf; 

540 iov[1]iov len = len; 

541 if (writev(db->idxfd, &iov[0], 2) != PTR SZ + 
IDXLEN_SZ + len) 

542 err_dump("_db_writeidx: writev error of index 
record"); 

543 if (whence == SEEK_END) 

544 if (un_lock(db->idxfd, ((db->nhash+1)*PTR_SZ)+1, 

545 SEEK_SET, 0) < 0) 

546 err dump(" db writeidx: un lock error"); 

547 } 

548 /* 


549 * Write a chain ptr field somewhere in the index file: 
550 * the free list, the hash table, or in an index record. 
551 */ 


552 static void 

553 db writeptr(DB *db, off t offset, off t ptrval)554 { 

555 char asciiptr| PTR, SZ + 1]; 

556 if (ptrval < 0 || ptrval > PTR MAX) 

557 err quit(" db writeptr: invalid ptr: 96d", ptrval); 
558 sprintf(asciiptr, "%*lld", PTR. SZ, (long long)ptrval); 
559 if (lseek(db->idxfd, offset, SEEK. SET) == -1) 


560 err dump(" db writeptr: lseek error to ptr field"); 
561 if (write(db->idxfd, asciiptr, PTR, SZ) != PTR. SZ) 
562 err dump(" db writeptr: write error of ptr field"); 
563 } 


[5327-547] 定位 到 开始 写 索引 记录 的 位 置 ， 将 该 偏 移 量 存 入 DB 结 
构 的 idxoff 字段 。 因 为 在 两 个 独立 的 缓冲 区 中 构建 索引 记录 ， 所 以 调 
用 writev 将 它 存放 到 索引 文件 中 。 

如 采 是 退 加 写 该 文件 ， 则 释放 在 定位 操作 前 获得 的 锁 。 从 并 发 运 
行进 程 妃 加 新 记录 到 数据 库 的 角度 思考 问题 ， 那 么 这 把 锁 使 定位 操作 
和 写 操作 成 为 原子 操作 。 

[548~563] _db_writeptr 被 用 于 将 一 散 列 链 指针 写 至 索引 文件 中 。 
验证 该 指针 在 索引 文件 的 边界 范围 内 ， 然 后 将 它 转换 成 ASCII 字 人 符 捉 。 
按 指定 的 偏 移 量 在 索引 文件 中 定位 ， 然 后 将 该 指针 ASCII 字 符 串 写 入 索 
SIS 

564 /* 

565 * Store a record in the database. Return 0 if OK, 1 if record 

566 * exists and DB. INSERT specified, -1 on error. 

567 */ 

568 int 


569 db store DBHANDLE h, const char *key, const char *data, int 


flag) 

570 1 

571 DB *db - h; 

572 int rc, keylen, datlen; 

573 off t ptrval; 

574 if (flag !- DB INSERT && flag !- DB REPLACE && 

575 flag != DB. STORE) { 

576 errno = EINVAL; 

577 return(-1); 

578 } 

579 keylen = strlen(key); 

580 datlen = strlen(data) + 1; /* +1 for newline at end */ 

581 if (datlen < DATLEN_MIN || datlen > DATLEN_MAX) 

582 err_dump("db_store: invalid data length"); 

583 p 

584 * db find and lock calculates which hash table this new 
record 

585 * goes into (db->chainoff), regardless of whether it already 

586 * exists or not. The following calls to. db writeptr change 
the 

587 * hash table entry for this chain to point to the new record. 

588 * The new record is added to the front of the hash chain. 

589 $i 

590 if ( db find and lock(db, key, 1) « 0) { /* record not found 
"y 


591 if (flag == DB. REPLACE) ( 


592 IC = -1; 


593 db->cnt_storerr++; 

594 errno = ENOENT; /* error, record does 
not exist */ 

595 goto doreturn; 

596 } 


[564~582] db_store EN AH) B ee — Zi YO S US UM Bae HH ^ EL 
先 验证 参数 flag 的 值 。 然 后 ， 检 查 数据 记录 长 度 是 否 有 效 。 如 果 无 效 ， 
则 删除 core 文 件 并 终止 。 作 为 一 个 例子 这 样 处 理 无 可 厚 非 ， 但 如 果 构 造 
正式 应 用 的 函数 库 ， 那 么 最 好 返回 出 错 状态 而 非 终止 ， 这 样 可 以 给 应 
用 程序 一 个 恢复 的 机 会 。 

[583--596] 调用 _db_find_and_lock 以 查看 这 个 记录 是 否 已 经 存在 。 
如 果 记 录 并 不 存在 且 指 定 的 标志 为 DB_INSERT 或 DB_STORE， 或 者 
记录 存在 且 指 定 的 标志 为 DB_REPLACE 或 DB_STORE， 那 么 这 些 都 是 
允许 的 。 替 换 一 条 已 有 的 记录 意味 着 键 不 变 ， 而 数据 记录 很 可 能 不 
同 。 注 意 ， 因 为 db store 很 可 能 会 改变 散 列 链 ， 所 以 调用 
_db_find_and_lock 的 最 后 一 个 参数 指明 要 对 散 列 链 加 写 锁 。 


597 p 

598 * db find and lock locked the hash chain for us; 
read 

599 * the chain ptr to the first index record on hash chain. 

600 */ 

601 ptrval = _db_readptr(db, db->chainoff); 

602 if ( db findfree(db, keylen, datlen) < 0) { 

603 [* 

604 * Can't find an empty record big enough. 


Append the 


605 
files. 
606 
607 
608 
609 
610 
new 
611 
612 
613 
614 
615 
616 
617 
it from 
618 
>idxoff. 
619 
chain. 
620 
621 
622 
ptrval); 
623 
624 
625 


* new record to the ends of the index and data 


*/ 
_db_writedat(db, data, 0, SEEK_END); 
_db_writeidx(db, key, 0, SEEK. END, ptrval); 
/* 
* db->idxoff was set by _db_writeidx. The 


* record goes to the front of the hash chain. 
*/ 
_db_writeptr(db, db->chainoff, db->idxoff); 
db->cnt_stor1++; 
} else { 
/水 


* Reuse an empty record. db findfree removed 
* the free list and set both db->datoff and db- 
* Reused record goes to the front of the hash 
*/ 
_db_writedat(db, data, db->datoff, SEEK. SET); 


_db_writeidx(db, key, db->idxoff, SEEK. SET, 


_db_writeptr(db, db->chainoff, db->idxoff); 


db->cnt_stor2++; 


[597—601] 在 调用 _db find and lock 后 ， 代 码 分 成 4 种 情况 。 前 两 
种 情况 中 ， 没 有 找到 足够 大 的 空 几 记录 ， 所 以 添加 一 条 新 纪录 。 读 散 
列 链 上 第 一 项 的 偏 移 量 。 

[602--614] 第 1 种 情况 : 调用 _db_findfree 在 空闲 链表 中 搜索 一 条 已 
删除 的 记录 ， 它 的 键 长 度 和 数据 长 度 与 参数 keylen 和 datlen 相 同 。 如 果 
没有 找到 对 应 大 小 的 空间 记录 ， 这 意味 着 要 将 这 条 新 记录 追加 a 到 索引 
文件 和 数据 文件 的 末尾 。 调 用 _db_writedat 写 数据 部 分 ， 调 用 
_db_writeidx 写 索引 部 分 ， 调 用 _db_writeptr 将 新 记录 添加 a 到 对 应 的 散 列 
链 的 头 部 。 将 执行 此 种 情况 的 计数 器 (cnt_stor1) 值 加 1， 以 便 观 察 数 
据 库 的 运行 状况 。 

[6157-625] 第 2 种 情况 : __db_findfree 找 到 对 应 大 小 的 空 记录 ， 然 后 
将 这 条 空 记录 从 空间 链 表 中 移 除 〈 稍 后 就 会 看 到 _db_findfree 的 实 
HE) ， 写 入 新 的 索引 记录 和 数据 记录 ， 然 后 ， 如 同 第 1 种 情况 一 样 ， 
将 新 记录 添加 到 对 应 的 散 列 链 的 头 部 。 将 执行 此 种 情况 的 计数 器 

(cnt stor2) 值 加 1， 以 便 观 察 数 据 库 的 运行 状况 。 


626 ) else 1 /* record found */ 

627 if (flag == DB. INSERT) { 

628 Ic = 1; /* error, record already in db */ 

629 db->cnt_storerr++; 

630 goto doreturn; 

631 } 

632 Pp 

633 * We are replacing an existing record. We know the 
new 

634 * key equals the existing key, but we need to check if 

635 * the data records are the same size. 


636 */ 


637 if (datlen != db->datlen) 1 


638 _db_dodelete(db); /* delete the existing record */ 

639 /* 

640 * Reread the chain ptr in the hash table 

641 * (it may change with the deletion). 

642 */ 

643 ptrval = _db_readptr(db, db->chainoff); 

644 /* 

645 * Append new index and data records to end of 
files. 

646 e 

647 _db_writedat(db, data, 0, SEEK, END); 

648 _db_writeidx(db, key, 0, SEEK. END, ptrval); 

649 /* 

650 * New record goes to the front of the hash 
chain. 

651 */ 

652 _db_writeptr(db, db->chainoff, db->idxoff); 

653 db->cnt_stor3++; 

654 } else { 


[626~ 631] 另 两 种 情况 是 具有 相同 键 的 记录 在 数据 库 中 已 存在 ， 
如 采 不 想 蔡 换 该 记录 ， 则 设置 表示 一 条 记录 已 经 存在 的 返回 码 ， 将 存 
储 出 错 计 数 的 计数 器 cnt_storerr 值 加 1， 然 后 跳 较 至 图 数 末 尾 ， 在 此 处 
HASHR ENZ o 

[632~654] 第 3 种 情况 : 要 替换 一 条 已 有 记录 ， 而 痢 数 据 记录 的 
长 度 与 已 有 记录 的 长 度 不 一 样 。 调 用 _db_dodelete 删 除 已 有 记录 ， 将 该 
删除 记录 放 在 空间 链表 头 部 。 然 后 ， 调 用 _db_writedat 和 _db_writeidx 


将 新 记 杂 追加 到 索引 文件 和 数据 文件 的 末尾 (也 可 以 用 其 他 方法 ， 如 
可 以 再 找 一 找 是 否 有 数据 大 小 正好 的 已 删除 的 记录 项 ) 。 最 后 调用 


_db_writeptr 将 新 记录 添加 到 对 应 的 散 列 链 的 头 部 。DB 结 构 中 的 


cnt_stor3 计 数 姻 记录 发 生 此 种 情况 的 次 数 。 


*/ 


655 /* 

656 * Same size data, just replace data record. 

657 */ 

658 _db_writedat(db, data, db->datoff, SEEK_SET); 
659 db->cnt_stor4++; 

660 } 

661 } 

662 rc = 0; /* OK */ 


663 doreturn: /* unlock hash chain locked by _db_find_and_lock 


664 if (un_lock(db->idxfd, db->chainoff, SEEK_SET, 1) < 0) 
665 err_dump("db_store: un lock error"); 
666 return(rc);667 }668 /* 


669 * Try to find a free index record and accompanying data record 
670 * of the correct sizes. We're only called by db_store.671 */ 

672 static int 

673 _db_findfree(DB *db, int keylen, int datlen)674 { 


675 int IC; 

676 off t offset, nextoffset, saveoffset; 
677 We 

678 * Lock the free list. 

679 "y 


680 . if(writew lock(db-»idxfd, FREE OFF, SEEK. SET, 1) < 0) 


681 err dump(" db findfree: writew lock error"); 
682 p 


683 * Read the free list pointer. 

684 */ 

685 saveoffset = FREE OFF; 

686 offset - db readptr(db, saveoffset); 


[6557-661] 第 4 种 情况 .替换 一 条 已 有 记录 ， 而 新 数据 记录 的 长 
度 与 已 有 记录 的 长 度 恰 好 一 样 。 这 是 最 容易 的 情况 ， 只 需要 重 写 数据 
记录 即 可 ， 并 将 这 种 情况 的 计数 器 (cnt stor4) 值 加 1。 

[6627-667] 在 正常 情况 下 ， 设 置 表 示 成 功 的 返回 码 ， 然 后 进入 公 
共 返 回 逻 辑 。 对 散 列 链 解锁 (这 把 锁 是 由 调用 _db_find_and_lock 而 加 上 
HJ) ， 然 后 返回 调用 者 。 

[668 ~ 686] dbfindfree 芳 数 试 图 找到 一 个 指定 大 小 的 空 几 索引 记录 
和 相关 联 的 数据 记录 。 需 要 对 空闲 链表 加 写 锁 以 避免 与 其 他 使 用 空闲 
链表 的 进程 互相 影响 。 在 对 空 闪 链表 加 写 锁 后 ， 得 到 空间 链表 的 头 指 
针 地 址 。 


687 while (offset != 0) { 

688 nextoffset - db readidx(db, offset); 

689 if (strlen(db->idxbuf) == keylen && db->datlen == 
datlen) 

690 break; /* found a match */ 

691 saveoffset = offset; 

692 offset = nextoffset; 

693 } 

694 if (offset == 0) { 

695 rc = -1; /* no match found */ 


696 ) else { 


697 [5 


698 * Found a free record with matching sizes. 

699 * The index record was read in by _db_readidx above, 
700 * which sets db->ptrval. Also, saveoffset points to 
701 * the chain ptr that pointed to this empty record on 
702 * the free list. We set this chain ptr to db->ptrval, 
703 * which removes the empty record from the free list. 
704 */ 

705 _db_writeptr(db, saveoffset, db->ptrval); 

706 rc = 0; 

707 p 

708 * Notice also that. db readidx set both db->idxoff 
709 * and db->datoff. This is used by the caller, db store, 
710 * to write the new index record and data record. 

711 mh 

712 } 

713 /* 

714 * Unlock the free list. 

715 */ 

716 if (un_lock(db->idxfd, FREE_OFF, SEEK. SET, 1) < 0) 
717 err dump(" db findfree: un lock error"); 

718 return(rc); 

719 } 


[687~ 693] db findfree 中 的 while 循环 遍历 空闲 链表 以 搜寻 一 个 
能 够 匹配 键 长 度 和 数据 长 度 的 索引 记录 项 。 在 这 个 简单 的 实现 中 ， 只 
有 当 一 个 已 删除 记录 的 键 长 度 及 数据 长 度 与 要 插入 的 新 记录 的 键 长 度 


及 数据 长 度 一 样 时 才 重 用 已 删除 记录 的 空间 。 还 有 其 他 更 好 的 算法 ， 
但 复杂 度 会 增加 。 

[694—712] 如 果 找 不 到 所 有 要求 键 长 度 和 数据 长 度 的 可 用 记录 ， 则 
设置 表示 失败 的 返回 码 。 否 则 ， 将 已 找到 记录 的 下 一 个 链 指针 写 至 前 
一 记录 的 链表 指针 。 这 样 就 从 空 用 链表 中 移 除了 该 记录 。[713~~719] 
一 旦 结束 对 空 几 链表 的 操作 ， 立 即 释 放 写 锁 。 然 后 对 调用 者 返回 状态 
RB o 


720 /* 
721 * Rewind the index file for db nextrec.722 * Automatically called 
by db open.723 * Must be called before first db nextrec.724 */ 


725 void 
726 db. rewind(«DBHANDLE h)727 { 
728 DB *db = h; 


729 off t offset; 
730 offset = (db->nhash + 1) * PTR, SZ; /* +1 for free list ptr */ 


731 p 

732 * We're just setting the file offset for this process 

733 * to the start of the index records; no need to lock. 

734 * +1 below for newline at end of hash table. 

735 */ 

736 if ((db->idxoff = lseek(db->idxfd, offset+1, SEEK_SET)) == 
-1) 

737 err dump("db rewind: lseek error");738 }739 /* 

740 * Return the next sequential record. 


741 * We just step our way through the index file, ignoring deleted 
742 *records. db rewind must be called before this function is 


743 * called the first time. 


744 Tf 


745 char * 
746 db nextrec(DBHANDLE h, char *key)747 { 
748 DB *db = h; 


749 char C; 

750 char *ptr; 

[720—738] db rewind ER ZH] FIL aia HB SEE TRAN”, HR 
引文 件 的 文件 偏 移 量 设置 为 指向 第 一 条 索引 记录 ( 紧 跟 在 散 列 表 之 
后 ) 。 (回忆 图 20-2 中 索引 文件 的 结构 。) 

[7397-750] db_nextrec 芳 数 返回 数据 库 的 下 一 条 记录 。 返 回 值 是 指 
回 数据 缓冲 区 的 指针 。 如 果 调 用 者 提供 的 key 参 数 非 军 ， 将 相应 的 键 复 
制 到 该 缓冲 区 中 。 调 用 者 负责 分 配 可 以 存放 链 的 足够 大 的 缓 促 区 。 大 
小 为 IDXLEN_MAX 字 节 的 缓冲 区 足够 存放 任意 键 。 记 录 按 数据 库 文 件 
中 存放 的 顺序 逐一 返回 。 也 就 是 说 ， 记 录 并 不 按键 值 大 小 排序 。 另 
外 ，db_nextrec 并 不 跟随 散 列 链表 ， 所 以 已 删除 的 记录 也 会 被 读 取 ， 但 
是 不 同调 用 者 返回 这 种 已 删除 记录 。 


751 /* 

752 * We read lock the free list so that we don't read 

753 * a record in the middle of its being deleted. 

754 "i 

755 if (readw lock(db-»idxfd, FREE OFF, SEEK. SET, 1) < 0) 
756 err dump("db nextrec: readw. lock error"); 

757 do 1 

758 kt 

759 * Read next sequential index record. 

760 */ 


761 if ( db readidx(db, 0) < 0) { 


762 ptr = NULL; /* end of index file, EOF */ 


763 goto doreturn; 

764 } 

765 "n 

766 * Check if key is all blank (empty record). 

767 "i 

768 ptr = db->idxbuf; 

769 while ((c = *ptr++) !=0 && c== SPACE) 

770 ; /* skip until null byte or nonblank */ 
77 } while (c == 0);/* loop until a nonblank key is found */ 
772 if (key !- NULL) 

773 strcpy(key, db->idxbuf);  /* return key */ 

774 ptr = db readdat(db);/* return pointer to data buffer */ 
775 db->cnt_nextrec++; 

776 doreturn: 

777 if (un_lock(db->idxfd, FREE_OFF, SEEK. SET, 1) < 0) 
778 err dump("db nextrec: un lock error"); 

779 return(ptr); 

780 } 


[7517-756] 对 至亲 链表 加 读 锁 ， 使 得 正在 读 该 链表 时 ， 其 他 进程 
不 能 从 中 移 除 记录 。 

[757-771] 调用 _db_readidx 读 下 一 个 记录 。 传 送 给 该 函数 的 偏 移 
量 参数 值 为 0， 以 此 通知 该 钞 数 从 当前 偏 移 量 继续 读 索引 记录 。 因 为 正 
在 逐条 顺序 读 索 引文 件 ， 所 以 会 读 到 已 删除 的 记录 。 仅 需 返 回 有 效 记 
录 ， 所 以 跳 过 键 是 全 空格 的 记录 〈 回 忆 _db_dodelete 函 数 以 设置 全 空格 
方式 清除 键 ) 。 


[772-780] 1X3] — AHEM, "VR Se Opeth, DUE 
AER SEDE o AAR, FRE KE NTS 
DEIR PRAE UT DCH RET IE. o HST eae 1, LAS A RERO 
WS, spp IHR IRIS IRL 。 

通常 在 下 列 形式 的 循环 中 使 用 db _rewind 和 db_nextrec 这 两 个 函数 : 

db rewind(db); 

while ((ptr = db nextrec(db, key)) != NULL) 1 

/* process record */ 

} 

前 面 曾 警 告 过 ， 记 录 的 返回 没有 一 定 的 顺序 ， 它 们 并 不 按键 的 顺 
序 返回 。 

如 采 db_nextrec 贸 数 在 循环 中 被 调用 时 数据 库 正在 被 修改 ， 则 
db_nextrec 返 回 的 记录 只 是 变化 中 的 数据 库 在 某 一 时 间 操 的 快照 

(snapshot) 。db_nextrec 被 调用 时 总 是 返回 一 条 “正确 ”的 记录 ， 也 就 是 
说 它 不 会 返回 一 条 已 删除 的 记录 。 但 有 可 能 一 条 记录 刚 补 db_nextrec 返 
回 后 就 被 删除 。 类 似 地 ， 如 果 db_nextrec 刚 跳 过 一 条 已 删除 的 记录 ， 这 
条 记录 的 空间 就 被 一 条 新 记录 重用 ， 除 非 用 db_rewind 重 新 思 历 一 志 ， 
否则 在 结果 中 看 不 到 这 条 新 的 记录 。 如 果 通 过 db_nextrec 获 得 一 份 数据 
库 的 准确 的 “冻结 ”的 快照 很 重要 ， 则 在 这 段 时 间 内 应 该 不 做 插入 和 删 
除 操作 。 

下 面 来 看 db_nextrec 使 用 的 加 锁 。 因 为 并 不 使 用 任何 散 列 链表 ， 也 
不 能 判断 每 条 记录 属于 哪 条 散 列 链 。 所 以 有 可 能 当 db_nextrec 读 取 一 条 
记录 时 ， 其 索引 记录 正在 被 删除 。 为 了 防止 这 种 情况 ，db_nextrec 对 空 
闲 链表 加 读 锁 ， 这 样 就 可 避免 与 _db_dodelete 和 _db_findfree 相 互 影响 。 

在 结束 对 db.c 源 文件 的 说 明之 前 ， 对 回 文 件 来 尾 退 加 索引 记录 或 
数据 记录 时 的 加 锁 再 做 一 些 说 明 。 在 第 1 种 和 第 3 种 情况 中 ，db_store 调 
Hj db writeidx 和 _db_writedat 时 ， 第 3 个 参数 为 0， 第 4 个 参数 为 


SEEK_END。 这 里 ， 第 4 个 参数 作为 一 个 标志 用 来 告诉 这 两 个 函数 ， 新 
的 记录 将 被 追加 到 文件 的 末尾 。_db_writeidx 用 到 的 技术 是 对 索引 文件 
加 写 锁 ， 加 锁 的 范围 从 散 列 链 的 末尾 到 文件 的 末尾 。 这 不 会 影响 其 他 
数据 库 的 读 进程 和 写 进程 (这 些 进程 将 对 散 列 链 加 锁 ) ， 但 如 果 其 他 
ie db store 来 追加 数据 则 会 被 锁 住 。_db_writedat 使 用 的 方 

是 对 整个 数据 文件 加 写 锁 。 同 样 这 也 不 会 影响 其 他 数据 库 的 读 进程 
ibn (它们 甚至 不 对 数据 文件 加 锁 ) ， 但 如 果 其 他 用 户 此 时 调用 
db store 来 同 数 据 文件 追加 数据 则 会 被 锁 住 (见习 题 20.3) ° 


20.9 性 能 


为 了 测试 这 一 数据 库 函 数 库 ， 也 为 了 获得 一 些 与 典型 应 用 的 数据 
访问 模式 有 关 的 时 间 测 量 数据 ， 编 写 了 一 个 测试 程序 。 该 程序 接受 两 
个 命令 行 参 数 : 要 创建 的 子 进 程 的 个 数 和 每 个 子 进程 向 数据 库 写 的 数 
据 记 录 的 条 数 (nrec) 。 然 后 — open) 创建 一 个 空 的 数据 
库 ， 通 过 fork 创 建 指定 数目 的 子 进程 ， 等 待 所 有 子 进 程 结束 。 每 个 子 进 
程 执行 以 下 步骤 。 

(1) 向 数据 库 写 nrec 条 记录 。 

(2) 通过 键 值 读 回 nrec 条 记录 。 

(3) 执行 下 面 的 循环 nrecx5 次 。 

(a) 随机 读 一 条 记录 。 

(b) 每 循环 37 次 ， 随 机 删除 一 条 记录 。 
(c) 每 循环 11 次 ， 随 机 插入 一 条 记录 并 读 取 这 条 记录 。 

(d) 每 循环 17 次 ， 随 机 替换 一 条 记录 为 新 记录 。 在 连续 两 次 蔡 
换 中 ， 一 次 用 同样 大 小 的 记录 替换 ， 一 次 用 比 以 前 更 长 的 记录 蔡 换 。 


C 


(4) 将 此 子 进程 写 的 所 有 记录 删除 。 每 删除 一 条 记录 ， 随 机 地 查 
找 10 条 记录 ° 

DB 结构 的 cnt_xxx 变 量 记录 对 数据 库 进 行 的 操作 数 ， 这 些 变 量 的 值 
在 函数 中 增加 。 每 个 子 进程 的 操作 数 一 般 都 会 与 其 他 子 进程 不 一 样 ， 
因为 每 个 子 进 程 用 来 选择 记录 的 随机 数 生 成 器 是 根据 其 进程 ID 来 初始 
化 的 。 每 个 子 进程 操作 的 典型 计数 值 见 图 20-6。 

读 取 的 次 数 大 约 是 存储 和 删除 的 10 倍 ， 这 可 能 是 许多 数据 库 应 用 
程序 的 典型 情况 。 

每 一 个 子 进程 只 对 该 子 进程 所 写 的 记录 执行 这 些 操作 〈 读 取 、 存 
储 和 删除 ) 。 由 于 所 有 的 子 进 程 对 同一 个 数据 库 进 行 操 作 (虽然 对 不 
同 的 记录 ) ， 所 以 会 使 用 并 发 控制 。 数 据 库 中 的 记录 总 数 与 子 进程 数 
成 比例 。 ( 当 只 有 一 个 子 进程 时 ， 一 开始 有 nrec 条 记录 写 入 数据 库 ， 当 
有 两 个 子 进程 时 ， 一 开始 有 nrec x2 条 记录 写 入 数据 库 ， 依 此 类 推 。) 

通过 运行 测试 程序 的 3 个 不 同 版 本 来 比较 加 粗 粒 度 锁 和 加 细 粒 度 锁 
提供 的 并 发 ， 并 且 比 较 3 种 不 同 的 加 锁 方式 (不 加 锁 、 建 议 性 锁 和 强制 
性 锁 ) 。 第 一 个 版 本 使 用 20.8 节 中 的 源 代码 ， 称 为 细 粒 度 锁 版 本 。 第 
二 个 版 本 通过 改变 加 锁 调 用 而 使 用 粗 粒 度 锁 ，20.6 节 对 此 已 介绍 过 。 第 
三 个 版 本 将 所 有 加 锁 例 程 均 去 挤 ， 这 样 可 以 计算 出 加 锁 的 开销 。 通 过 
改变 数据 库 文件 的 权限 标志 位 ， 还 可 以 使 第 一 个 版 本 和 第 二 个 版 本 
(加 细 粒 度 锁 和 加 粗 粒 度 锁 ) 使 用 建议 性 锁 或 强制 性 锁 (本 节 所 有 的 
测试 中 ， 仅 对 加 细 粒 度 锁 的 实现 测量 了 采用 强制 性 锁 的 时 间 ) e 


操作 


调用 fcnt1 每 个 操作 ) 


操作 计数 


粗 粒 度 锁 


细 粒 度 锁 (nrec=2 000) 


db store. 
db store. 
db store. 
db store. 
db store, 
db fetch; 
db fetch, 


DB_INSERT， 无 空白 记录 ， 追 加 
DB_INSERT， 重 用 空白 记录 
DB_REPLACE， 数 据 长 度 不 同 ， 追 加 
DB_REPLRACE， 数 据 长 度 相同 

没有 找到 记录 

找到 记录 

没有 找到 记录 
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db_delete， 找 到 记录 
db delete, 没有 找到 记录 
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图 20-6 每 个 子 进程 操作 的 典型 计数 值 
本 广 所 有 的 测试 都 是 在 一 台 


台 运 行 Linux 3.2.0 的 Intel Core-i5 系 统 上 运 


行 的 。 这 个 系统 拥有 4 个 内 核 ， 因 此 可 以 允许 至 多 4 个 进程 并 发 运行 。 


1. 单 进程 的 结果 


图 20-7 显 示 了 只 有 一 


000 和 12 000。 


个 子 进 程 运 行 


建议 性 锁 | 


粗 粒度 锁 细 粒 度 锁 | > 


LE 


了 的 结果 ，nrec 分 别 为 2 000 ^ 6 


强制 性 锁 


ss Ia AE 


2000 0.10 | 0.22 | 0.33 
6000 0.59 | 1.32 1.91 
12000 || 4.37 | 9.58 | 13.97 


图 20-7 È 


LE 子 进程 、 不 同 的 nrec 和 不 同 的 加 锁 方 法 


ESL. 0.51 0.13 0.38 0.51 0.14 0.43 0.58 
2.13 | 3.03 0.90 2.14 3.05 0.99 2:52 3.53 
12.60 | 18.01 5.34 12.63 18.01 5.53 | 15.03 | 20.60 


最 后 12 列 显示 的 是 以 秒 为 单位 的 时 间 o TE BUR OL P HP 


CPU 时 间 加 上 系统 CPU 时 间 都 基本 上 等 于 时 钟 时 间 。 


这 一 组 测试 受 CPU 


限制 而 不 是 受 磁 一 操作 限制 。 
中 间 6 列 (建议 性 锁 ) 对 加 粗 粒 度 锁 和 加 细 粒 度 锁 的 结果 基本 一 
样 。 这 是 可 以 理解 的 ， 因 为 对 于 单个 进程 来 说 加 粗 粒 度 锁 和 加 细 粒 度 


MAA KAI, 


除了 额外 的 fcnt 调 用 。 


比较 不 加 锁 和 加 建议 性 锁 ， 可 以 看 到 加 锁 调 用 在 系统 CPU 时 间 上 
增加 了 32% 一 739%“。 即 使 这 些 锁 实 际 上 并 没有 使 用 过 (因为 只 有 一 个 进 
程 运 行 ) ，fcnt 系统 调用 仍 会 有 一 些 时 间 的 开销 。 用 户 CPU 时 间 对 4 种 
不 同 的 加 锁 方法 基本 上 一 样 ， 这 是 因为 用 户 代 码 基本 上 是 一 样 的 ( 除 
了 调用 fcntl 的 次 数 有 些 不 同 ) e 

关于 图 20-7 要 注意 的 最 后 一 点 是 强制 性 锁 比 建议 性 锁 增 加 了 13% 一 
199% 的 系统 CPU 时 间 。 由 于 对 加 强制 性 细 粒 上 度 锁 和 加 建议 性 细 粒 度 锁 的 
调用 次 数 是 一 样 的 ， 所 以 增加 的 系统 开销 来 自 读 和 写 。 

最 后 的 测试 是 有 多 个 子 进程 的 不 加 锁 的 程序 。 与 预期 的 一 样 ， 结 
果 是 随机 的 错误 。 一 般 错 误 情况 包括 : 添加 到 数据 库 中 的 记录 找 不 
到 、 测 斌 程序 异常 退出 等 。 几 平 每 次 运行 测试 程序 ， 都 有 不 同 的 错误 
发 生 。 这 是 典型 的 竞争 条 件 一 多 个 进程 在 没有 任何 加 锁 的 情况 下 修改 
同一 个 文件 ， 错 误 情 况 不 可 预测 。 

2. 多 进程 的 结果 

下 一 组 测试 主要 目的 是 比较 粗 粒 度 锁 和 细 粒 度 锁 的 不 同 。 前 面 说 
过 ， 由 于 加 细 粒 上 度 锁 时 数据 库 的 各 个 部 分 被 锁 住 的 时 间 比 加 粗 粒 度 锁 
少 ， 所 以 从 直觉 上 说 ， 加 细 粒 度 锁 应 该 能 提供 更 好 的 并 发 性 。 图 20-8 显 
示 了 nrec 取 2 000， 子 进程 数 从 1 一 16 的 测试 结果 。 


建议 性 锁 强制 性 锁 


图 20-8 nrec=2000 时 不 同 加 锁 方 法 的 比较 


所 有 的 用 户 时 间 、 系 统 时 间 和 时 钟 时 间 的 单位 均 为 秒 。 所 有 这 些 
时 间 均 是 父 进程 与 所 有 子 进 程 的 总 和 。 关 于 这 些 数 据 有 许多 需要 考 
Eo 

首先 要 注意 的 是 ， 当 使 用 多 进程 时 ， 用 户 时 间 和 系统 时 间 之 和 超 

过 了 时 钟 时 间 。 乍 看 起 来 这 有 点 奇怪 ， 不 过 当 采 用 多 核 时 是 正常 的 。 
此 时 ， 所 有 并 发 的 进程 在 运行 时 其 时 间 会 累积 起 来 ; 所 显示 的 CPU 处 
理 时 间 是 程序 运行 的 所 有 核 运 转 的 时 间 之 和 。 因 为 可 以 并 发 多 个 进程 
(每 个 核 运行 一 个 进程 ) ， 所 以 CPU 处 理 时 间 会 超过 时 钟 时 间 。 

第 8 Fil s n ， 是 加 建议 性 粗 粒 度 锁 与 加 建议 性 细 粒 
度 锁 的 运行 时 钟 时 间 的 百分比 差 。 从 中 可 以 看 到 使 用 细 粒 度 锁 得 到 了 
2 ca c 对 于 单一 进程 加 粗 粒度 锁 与 加 
细 粒 度 锁 相 比 效 果 几 乎 相同 。 而 对 于 多 进程 ， 使 用 粗 粒 度 锁 的 时 间 消 
FSIK ( 约 30%) ° 


我 们 希望 从 粗 粒 度 锁 到 细 粒 度 锁 时 钟 时 间 会 减少 ， 当 启用 多 进程 
后 结 末 也 确实 如 此 。 然 而 ， 我 们 预期 当 对 任意 数量 的 进程 使 用 细 粒 度 
锁 时 系统 时 间 仍 然 会 保持 较 高 值 ， 因 为 使 用 细 粒 度 锁 会 发 出 更 多 的 fcntl 
调用 。 如 有 果 将 图 20-6 中 的 fcnt 调 用 次 数 加 在 一 起 ， 会 发 现 对 于 粗 粒 度 锁 
其 平均 值 为 87 858， 对 于 细 粒 度 锁 其 平均 值 为 115 520。 基 于 此 ， 我 们 
认为 由 于 增加 了 31% 的 fcnt 调 用 ， 所 以 会 增加 细 粒 度 锁 的 系统 时 间 。 然 
而 ， 在 测试 中 加 细 粒 度 锁 的 两 个 进程 其 系统 时 间 减 少 了 ， 超 过 两 个 进 
程 的 系统 时 间 只 有 小 幅 增 加 ， 这 让 人 困惑 。 

出 现 这 种 情况 有 两 个 原因 。 首 先 ， 图 20-7 显示 ， 当 没有 对 锁 进 行 
竞争 时 ， 粗 粒度 锁 和 细 粒 度 锁 的 时 间 之 间 没 有 显著 的 差别 。 这 说 明 对 
于 额外 的 fcnt 调 用 所 引起 的 CPU 负载 并 没有 影响 测试 程序 的 性 能 。 其 
次 ， 使 用 粗 粒 度 锁 时 ， 持 有 锁 的 时 间 较 长 ， 这 也 束 增 加 了 其 他 进程 因 
等 待 该 锁 而 陷入 阻塞 的 可 能 性 ， 而 使 用 细 粒 度 锁 时 ， 加 锁 的 时 间 较 
短 ， 进 程 被 姐 塞 的 可 能 性 就 降低 了 。 如 果 计 算 fend 的 阻塞 次 数 ， 会 发 
现在 使 用 粗 粒 度 锁 时 ， 进 程 阻塞 频率 更 高 。 例 如 ， 当 有 4 个 进程 时 ， 
使 用 粗 粒 度 锁 的 阻塞 次 数 几 乎 是 使 用 细 粒 度 锁 的 阻塞 次 数 的 5 倍 。 正 是 
这 些 粗 粒 度 锁 需 要 休 眼 和 唤醒 进程 的 额外 时 间 增 加 了 系统 时 间 ， 最 终 
降低 了 两 种 锁 的 系统 时 间 差 异 。 

最 后 一 列 EKARA) ， 是 从 加 建议 性 细 粒 度 锁 到 加 强制 性 
细 粒 度 锁 的 系统 CPU 时 间 百 分 比 的 增 量 。 从 这 些 值 可 以 看 到 ， 随 着 并 
发 数 的 增加 ， 强 制 性 锁 显著 增加 了 系统 时 间 (2096-7696) ° 

由 于 所 有 这 些 测试 的 用 户 代码 几乎 一 样 〈 对 加 建议 性 细 粒 度 锁 和 
强制 性 细 粒 度 锁 增 加 了 一 些 fcntl 调 用 ) ， 因 此 预期 对 每 一 行 的 用 户 CPU 
时 间 应 基本 一 样 。 

当 我 们 第 一 次 运行 这 些 测试 时 ， 测 斌 显示 对 于 多 进程 完成 锁 的 使 
用 ， 其 粗 粒 度 锁 的 用 户 时 间 几 乎 是 细 粒 度 锁 的 两 倍 。 因 为 两 个 数据 库 
版 本 是 相同 的 ， 除 了 调用 fcnt 的 次 数 不 同 ， 因 此 这 说 不 通 。 在 调查 研 


究 之 后 ， 我 们 发 现 使 用 粗 交 上 度 锁 时 会 有 更 多 的 竞争 ， 进 程 也 就 会 等 竺 
更 久 ， 操 作 系 统 于 是 就 决定 降低 CPU 时 钟 频率 来 节约 电量 。 在 使 用 细 
粒度 锁 时 ， 会 有 更 多 的 活动 ， 于 是 系统 提高 了 CPU 时 钟 频 率 。 这 使 得 
使 用 粗 粒 度 锁 比 使 用 细 粒 度 锁 运行 得 慢 。 在 人 禁用 系统 频率 调整 特性 
后 ， 我 们 的 测试 结果 就 没有 这 些 偏差 了 ， 用 户 时 间 的 差别 也 就 小 多 
了 o 

图 20-8 的 第 一 行 与 图 20-7 中 的 nrec 取 2 000 的 那 一 行 很 相似 。 这 与 预 
期 一 致 。 

图 20-9 是 图 20-8 中 加 建议 性 细 粒 度 锁 的 数据 图 。 我 们 绘制 了 进程 数 
从 1~16 的 时 钟 时 间 ， 也 绘制 了 用 户 CPU 时 间 除 以 进程 数 后 的 每 进程 用 
户 CPU 时 间 ， 另 外 还 绘制 了 每 进程 系统 CPU 时 间 。 

注意 ， 这 两 个 每 进程 CPU 时 间 都 是 线性 的 ， 但 时 钟 时 间 是 非 线性 
的 。 可 能 的 原因 是 : 当 进 程 数 增 大 时 ， 操 作 系统 用 于 进程 切换 的 CPU 
时 间 增 多 。 操 作 系 统 的 开销 会 增加 时 钟 时 间 ， 但 不 会 影响 单个 进程 的 
CPU 时 间 。 

用 户 CPU 时 间 随 进程 数 增加 的 原因 可 能 是 因为 数据 库 中 有 了 更 多 
的 记录 。 每 一 条 散 列 链 更 长 ， 所 以 _db_find_and_lock 画 数 平 均 要 运行 更 
长 时 间 来 找到 一 条 记录 。 


每 进程 系统 CPU 时 间 ， 
每 进程 用 户 CPU 时 间 


(s) 


每 进程 系统 CPU 时 间 
时 钟 时 间 40 — 
(s) 


时 钟 时 间 


每 进程 用 户 CPU 时 间 
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进程 数 
图 20-9 图 20-8 中 使 用 建议 性 细 粒 度 锁 的 数据 


| 
12 3 


20.10 小 结 


本 章 详细 介绍 了 一 个 数据 库 函 数 库 的 设计 与 实现 。 考 虑 到 篇 幅 ， 
这 个 画 数 库 尽 可 能 小 和 简单 ， 但 也 包括 了 多 进程 并 发 访问 需要 的 对 记 
录 加 锁 的 功能 。 

此 外 ， 还 使 用 不 同 数量 的 进程 以 及 不 同 的 加 锁 方 法 : 不 加 锁 、 建 
WERD 〈 细 粒度 锁 和 粗 粒 度 锁 ) 和 强制 性 锁 ， 研究 了 这 个 函数 库 的 性 
能 。 可 以 看 到 加 建议 性 锁 比 不 加 锁 在 时 钟 时 间 上 增加 了 299% 一 59%， 加 
强制 性 锁 比 加 建议 性 锁 耗 时 再 增加 约 159%。 


习题 


20.1 f£ db dodelete 中 使 用 的 加 锁 是 比较 保守 的 。 例 如 ， 如 采 等 到 
真正 要 用 空 闻 链表 时 再 加 锁 ， 则 可 获得 更 大 的 并 发 性 。 如 果 将 调用 
writew lock 移 到 调用 _db_writedat 4l db readptrZ IR] Z R &E fT A We? 

20.2 如 果 db_nextrec 不 对 空 采 链表 加 读 锁 而 被 读 的 记录 正在 被 删 
除 ， 描 述 在 怎样 的 情况 下 ， db_nextrec 会 返回 正确 的 键 但 是 空 的 (不 
正确 的 ) 数据 记录 。 (提示 : 查看 _db_dodelete * ) 

20.3 20.8 节 的 结尾 部 分 描述 了 _db_writeidx 和 _db_writedat 的 加 锁 。 
我 们 说 过 这 种 加 锁 不 会 干涉 除了 调用 db_store 之 外 的 其 他 的 读 进 程 和 
写 进 程 。 如 果 改 为 强制 性 锁 ， 这 还 成 立 吗 ? 

20.4 怎样 把 fsync 集 成 到 这 个 数据 库 函 数 库 中 ? 

20.5 在 db_store 中 ， 先 写 数据 记录 ， 然 后 再 写 索 引 记 录 。 如 采 将 顺 
FAB, SRE? 

20.6 建立 一 个 新 的 数据 库 并 写 入 一 些 记 录 。 写 一 个 程序 调用 
db_nextrec 来 读数 据 库 中 的 每 条 记录 ， 并 调用 _db_hash 来 计算 每 条 记录 
的 散 列 值 。 根 据 每 条 散 列 链 上 的 记录 数 画 出 直方 网 。_db_hash 中 的 散 列 
函数 是 否 能 满足 需求 ? 

20.7 修改 数据 库 函 数 ， 使 得 索引 文件 中 散 列 链 的 数目 可 以 在 数据 
库 建 立时 指定 。 

20.8 比较 两 种 情况 下 数据 库 函 数 的 性 能 : (a) 数据 库 与 测试 程序 
在 同一 台 机 器 上 ; (b) 数据 库 与 测试 程序 在 不 同 的 机 器 上 ， 经 由 NFS 
进行 访问 。 这 个 数据 库 函 数 库 提 供 的 记录 锁 机 制 还 能 工作 吗 ? 

20.9 只 有 当 键 缓冲 区 和 数据 缓冲 区 与 其 所 需 的 大 小 精确 匹配 时 ， 
数据 库 才 会 返回 空 几 链表 记录 。 请 修改 数据 库 以 使 空 朵 链表 可 以 使 用 
于 较 大 的 缓冲 区 来 满足 需求 。 应 该 如 何 更 改 数据 库 的 永久 格式 来 支持 
这 种 特性 呢 ? 

20.10 在 实现 了 习题 20.9 的 方案 后 ， 编 写 一 个 工具 以 使 数据 库 格 式 
可 以 从 一 种 转换 为 男 一 种 。 


21.1 引言 


现在 我 们 开发 一 个 能 够 与 网 络 打印 机 通信 的 程序 。 这 些 打 印 机 通 
过 以 太 网 与 多 个 计算 机 互联 ， 并 且 通 常 既 文 持 纯 文 本 文件 也 文 持 
PostScript 文 件 。 尽 管 一 些 应 用 程序 也 支持 其 他 通信 协议 ， 但 一 般 使 用 
网 络 打印 协议 (Internet Printing Protocol, IPP) 与 打印 机 通信 。 

我 们 将 描述 两 个 程序 打印 假 脱 机 守护 进程 (print spooler 
daemon) 将 作业 发 送 到 打印 机 ; 命令 行程 序 将 打印 作业 提交 到 假 脱 机 
守护 进程 。 因 为 假 脱 机 守护 进程 必须 处 理 很 多 操作 (与 客户 端 通信 来 
提交 作业 、 与 打印 机 通信 、 读 文件 、 扫 描 目 录 等 ) ， 这 就 提供 了 一 个 
机 会 来 使 用 前 面 章 市 所 提 到 的 范 数 。 例 如 ， 使 用 线程 (第 11 章 和 第 12 
章 ) 来 简化 假 脱 机 守护 进程 的 设计 ， 使 用 套 接 字 (第 16 章 ) 在 调度 文 
件 打印 的 程序 和 打印 假 脱 机 守护 进程 之 间 通 信 ， 也 可 以 在 打印 假 脱 机 
守护 进程 与 网 络 打 印 机 之 间 通 信 。 


21.2 Piz 3» 


网 络 打印 协议 (IPP) 为 建立 基于 网 络 的 打印 系统 指定 了 通信 规 
则 。 通 过 将 一 个 IPP 服 务 右 藤 入 到 市 网 卡 的 打印 机 中 ， 打 印 机 束 能 够 对 


许多 计算 机 系统 的 请 求 加 以 服务 。 这 些 计算 机 系统 实际 上 并 不 需要 在 
同一 个 物理 网 络 中 。 因 为 IPP 是 建立 在 标准 的 因特网 协议 上 的 ， 所 以 任 
何 一 台 能 够 与 打印 机 建立 TCP/IP 连 接 的 计算 机 都 能 向 打印 机 提交 打印 
作业 。 

IPP 由 一 系列 IETF 标准 文档 (Requests For Comment, RFC) 说 
明 ， 这 些 文档 可 以 在 http:/www.ietf. org/rfc.html 上 获得 。IEEE 相关 的 
打印 机 工作 组 (Printer Working Group) 制定 的 标准 草案 也 可 以 在 
http://www.pwg.org/ipp 上 获得 。 图 21-1 列 出 了 IPP 的 主要 文档 ， 还 有 许多 
其 他 文档 进一步 说 明了 过 程 管理 、 作 业 属 性 等 信息 。 


RFC 2567 IPP 设计 目标 
RFC 2568 IPP 模型 与 协议 架构 的 基本 原理 


RFC 2911 IPP/1.1: 模型 与 语义 
RFC 2910 IPP/1.1: 编码 与 传输 
RFC 3196 IPP/1.1: 实现 者 指南 


候选 标准 5100.12-2011 
图 21-1 基本 的 IPP 文 档 

候选 标准 5100.12-2100 指 明 实 现 提 供 的 所 有 功能 都 要 能 够 文 持 人 符合 
不 同 的 IPP 标 准 版 本 。 有 许多 建议 性 的 IPP 协 议 扩展 (具体 的 功能 在 IPP 
相关 文档 中 定义 ) 。 将 这 些 功能 分 组 创建 出 不 同 的 一 致 性 分 级 ; 每 一 
级 是 一 个 不 同 的 协议 版 本 。 对 于 兼容 性 ， 每 个 更 高 的 一 致 性 级 别 要 符 
合 低 版 本 定义 的 大 多 数 要 求 。 本 章 的 示例 中 使 用 的 是 IPP 1.1 版 本 。 

IPP 建 立 在 超 文本 传输 协议 (Hypertext Transfer Protocol, HTTP) 
之 上 (21.3 节 ) 。HTTP 又 建立 在 TCP/IP 之 上 。IPP 报 文 的 结构 如 图 21-2 
所 示 。 


以 太 网 IP TCP HTTP IPP 


首部 首部 首部 首部 首部 要 打印 的 数据 


图 21-2 IPP 报 文 结构 

IPP 是 请 求 响应 协议 。 客 户 端 发 送 请 求 到 服务 器 ， 服 务 器 用 响应 报 
文 回答 这 个 请 求 。IPP 首 部 包含 一 个 域 来 指示 所 需 操 作 ， 这 些 操作 可 以 
定义 成 提交 打印 作业 、 取 消 打 印 作业 、 获 取 作 业 属 性 、 获 取 打 印 机 属 
性 、 暂 售 和 重启 打印 机 、 挂 起 一 个 作业 和 释放 一 个 挂 起 的 作业 。 

图 21-3 显 示 了 一 个 IPP 首 部 的 结构 。 前 两 个 字 世 表示 IPP 版 本 号 ， 对 
于 1.1 版 本 协议 ， 每 个 字 节 的 值 是 1。 对 于 一 个 请 求 协议 ， 接 下 来 两 个 
字 节 包含 一 个 值 来 指示 请 求 操作 的 类 型 。 对 于 一 个 响应 协议 ， 这 两 个 
字 节 包含 一 个 状态 码 。 


(2 字 节 ) 
(2 字 节 ) 
(4 FH) 
(0-n FH) 
属性 结束 标志 (15617) 


图 21-3 IPP 首 部 结构 


接 下 来 4 字 闻 包含 一 个 整数 以 标识 请 求 ， 使 得 请 求 和 啊 应 相 匹配 。 
接着 是 可 选 的 属性 ， 然 后 用 属性 结束 标志 终止 。 紧 接着 属性 结束 标志 
之 后 是 任何 与 请 求 相关 联 的 数据 。 


在 首部 ， 整 数 以 有 符号 二 进 制 补 码 以 及 大 端 字 节 序 ( 即 网 络 字 市 
F) 方式 存储 。 属 性 按照 组 来 存储 。 每 个 组 都 以 标识 该 组 的 一 个 字 市 
开始 。 在 每 一 个 组 中 ， 属 性 通常 表示 为 :1 字 市 的 标志 ， 然 后 是 2 字 节 
属性 名 长 度 ， 接 着 是 属性 名 ， 然 后 是 2 字 刷 属性 值 长 度 ， 最 后 是 属性 值 
本 号 。 属 性 值 可 以 编码 成 字符 串 、 二 进 制 整数 或 者 更 为 复杂 的 结构 ， 
如 日 期 /时 间 惟 。 

图 21-4 显 示 了 attributes-charset 属 性 是 如 何 编码 成 utf-8 类 型 的 值 的 。 


属性 标志 = 0x47 (LFP) 
(2 Ft) 


(18 Ft) 


(2 #47) 


属性 值 = utf-8 (5 字 节 ) 


图 21-4 IPP 属 性 编码 样 例 


根据 所 请 求 的 操作 ， 一 些 属性 需要 在 请 求 报 文中 提供 ， 而 男 一 些 
是 可 选 的 。 例 如 ， 图 12-5 显 示 了 用 于 为 打印 作业 请 求 定 义 的 属性 。 


attributes-charset 
attributes-natural-language 
printer-uri 
requesting-user-name 


job-name 


ipp-attribute-fidelity 


document-name 
document-format 
document-natural-language 
compression 

job-k-octets 


job-impressions 


job-media-sheets 


text 或 name 类 型 属性 所 使 用 的 字符 集 

text 或 name 类 型 属性 所 使 用 的 自然 语言 

打印 机 的 统一 资源 标识 符 

提交 作业 的 用 户 名 (如 果 可 以 ， 可 用 于 认证 ) 

用 于 区 别 多 个 作业 的 作业 名 

如 果 为 真 ， 告 诉 打印 机 如 果 属 性 不 匹配 就 拒绝 作业 ; 否 
则 ， 打 印 机 尽 可 能 打印 作业 

文档 名 (如 适合 打印 一 个 旗 标 ) 

文档 格式 (如 纯 文本 、PostScript) 

文档 的 自然 语言 

压缩 文档 的 算法 

以 1024 字 节 单位 计算 的 文档 大 小 

作业 中 提交 的 图 ( 柑 入 在 页 面 中 的 图 像 ) 的 数量 

作业 打印 张 数 


图 21-5 打印 作业 请 求 的 属性 


IPP 首 部 包含 了 文本 和 二 进 制 混合 数据 。 属 性 名 存储 为 文本 ， 而 数 


据 大 小 存储 为 二 进 制 整数 。 这 使 得 构建 和 分 析 首 部 的 过 程 变 得 复杂 ， 
因为 需要 考虑 诸如 网 络 字 节 序 、 主 机 处 理 器 是 否 在 任意 字 万 边界 编 址 
对 齐 之 类 的 问题 。 一 个 较 好 的 可 选 方案 是 将 首部 设计 成 仅 包含 文本 。 
这 样 以 稍微 膨胀 一 些 协议 报 文 为 代价 简化 处 理 过 程 。 


HTTP V1.1 由 RFC 2616 说 明 。HTTP 也 是 请 求 响应 协议 。 请 求 报 文 
包含 的 一 个 开始 行 ， 跟 着 是 首部 行 ， 接 着 是 空白 行 ， 然 后 是 一 个 可 选 
的 实体 主体 。 在 我 们 这 种 情况 ， 实 体 主体 包含 IPP 首 部 和 数据 。 

HTTP 首 部 是 ASCII 码 ， 每 行 以 回 车 (w) 和 换行 符 (\n) 结束 。 开 

台 行 包含 一 个 method 来 指示 客户 端 请 求 的 操作 、 一 个 统一 资源 定位 符 
(Uniform Resource Locator, URL) 来 描述 服务 器 和 协议 、 一 个 字符 串 


来 表示 HTTP 版 本 。IPP 所 用 的 方法 仅 为 POST， 用 于 将 数据 发 送 到 服务 
ay o 

首部 行 指定 属性 ， 如 实体 主体 的 格式 和 长 度 。 一 个 首部 行 包 含 
个 属性 名 ， 后 紧 随 一 个 冒号 ， 接 着 是 可 选 的 空格 符 ， 然 后 是 属性 值 ， 
最 后 以 回 车 和 换行 从 结束 。 例 如 ， 为 了 指定 实体 主体 包含 IPP 报 文 ， 应 
包含 如 下 的 首部 行 : 

Content-Type: application/ipp 

下 面 是 对 于 作者 使 用 的 Xerox Phaser 8560 打 印 机 的 打印 请 求 的 
HTTP 首 部 样 例 。 

POST /ipp HTTP/1.1^M 

Content-Length: 21931^M 

Content-Type: application/ipp^M 

Host: phaser8560:631^M 

^M 

Content-Length 行 指明 了 HTTP 报 文中 数据 的 字 节 大 小 。 这 个 长 度 不 
包含 了 HTTP 首 部 的 大 小 ， 但 包括 IPP 首 部 的 大 小 。Host 行 指明 了 要 发 送 
FRISCH AR as EDL Pe Alois A e 

每 行 后 面 的 和 ^M 是 换行 符 前 的 回 车 符 。 换 行 符 不 能 被 显示 成 可 打印 
字符 。 注 意 ， 首 部 的 最 后 一 行 是 空 的 ， 只 有 回 车 和 换行 符 。 

HTTP Ae Dy FR SCA CENA TT Le TREFFER, KREE DAF 
状态 码 和 状态 信息 ， 最 后 以 一 个 回 车 和 换行 结束 。HITP 啊 应 报 文 的 剩 
余部 分 和 请 求 报 文 的 格式 一 样 : 首部 之 后 是 一 个 空白 行 和 可 选 的 实体 
主体 。 

打印 机 需要 发 送 给 我 们 如 下 的 报 文 作为 打印 请 求 的 回应 : 

HTTP/1.1 200 OK M 

Content-Type: application/ipp M 


Cache-Control: no-cache, no-store, must-revalidate'M 


Expires: THU, 26 OCT 1995 00:00:00 GMT^M 

Content-Length: 215 M 

Server: Allegro-Software-RomPager/4.34 M 

^M 

对 于 打印 假 脱 机 守护 进程 ， 我 们 只 关心 报 文 的 第 一 行 : 它 说 明了 
请 求 成 功 或 者 用 数字 错误 码 以 及 一 个 短 字符 串 表 示 请 求 失败 。 剩 下 的 
报 文 包含 了 附加 信息 ， 可 以 通过 在 客户 端 和 服务 万 间 的 万 点 来 控制 缓 
存 以 及 表明 运行 在 服务 器 上 的 软件 版 本 号 。 


21.4 


本 章 中 我 们 开发 的 程序 是 一 个 基本 的 打印 假 脱 机 守护 进程 。 一 个 
简单 的 用 户 命 令 发 送 一 个 文件 到 打印 假 脱 机 守护 进程 ， 假 脱 机 守护 进 
程 将 其 保存 到 磁盘 ， 将 请 求 送 入 队列 ， 最 终 将 文件 发 送 到 打印 机 © 

所 有 的 UNIX 系 统 至 少 提 供 一 个 打印 假 脱 机 系统 。FreeBSD 安 装 的 
是 BSD 的 打印 假 脱 机 系统 LPD (参见 lpd(8) 和 Stevens [1990] 第 13 章 ) ° 
Linux 和 Mac OS X@45CUPS, Common UNIX Printing System (参见 
cupsd(8)) 。Solaris 提 供 标 准 的 System V 打 印 假 脱 机 守护 进程 (参见 
Ip(1)flülpsched(1M)) 。 在 本 章 中 ， 我 们 的 兴趣 不 在 于 这 些 假 脱 机 系统 
本 身 ， 而 是 如 何 与 网 络 打印 机 通信 。 我 们 需要 开发 一 个 假 脱 机 系统 能 
够 解决 多 用 户 访问 单一 资源 (打印 机 ) 问题 。 

我 们 使 用 一 个 简单 的 命令 行程 序 读 取 一 个 文件 ， 将 其 送 到 打印 假 
脱 机 守护 进程 。 这 个 命令 行程 序 由 一 个 选项 来 强制 将 文件 按照 文本 来 
处 理 (默认 是 PostScript 文 件 ) 。 这 个 命令 行程 序 是 print 。 

在 我 们 的 打印 假 脱 机 守护 进程 printd 中 ， 使 用 多 线程 将 任务 分 解 给 
守护 进程 来 完成 。 


“一 个 线程 在 套 接 字 上 监听 从 运行 print 的 客户 端 发 来 的 新 打印 请 
求 o 

对 于 每 个 客户 端 产生 一 个 独立 的 线程 ， 将 要 打印 的 文件 复制 到 假 
脱 机 区 域 。 

一 个 线程 与 打印 机 通信 ， 一 次 发 送 一 个 队列 中 的 作业 。 

一 个 线程 处 理 信和 号。 

图 21-6 显 示 如 何 将 这 些 组 件 整 合 在 一 起 。 

打印 配置 文件 是 /etc/printer.conf。 这 个 文件 标识 了 运行 打印 假 脱 机 
守护 进程 的 服务 絮 主 机 名 和 网 络 打 印 机 的 主机 和 名。 以 printserver KF 
开始 的 行 标 识 了 假 脱 机 守护 进程 。 以 printer 天 键 字 开始 的 行 标识 了 打印 
机 ， 空 格 符 之 后 跟着 打印 机 的 主机 名 。 


printd 
打印 假 脱 机 
守护 进程 等 待 打印 文件 队列 


图 21-6 打印 假 脱 机 组 件 

一 个 打印 机 配置 文件 样 例 可 能 包公 下 列 行 : 

printserver fujin 

printer phaser8560 

其 中 fujin 古 运行 打印 假 及 机 守护 进程 的 计算 机 系统 主机 名 ， 
phaser8560 是 网 络 打 印 机 的 主机 名 。 我 们 假设 这 些 名 字 已 经 在 /etc/hosts 


中 列 出 或 者 已 经 通过 正在 使 用 的 任意 服务 进行 了 注册 ， 这 样 我 们 就 可 
以 将 这 些 名 字 转 换 成 网 络 地 址 。 

可 以 在 运行 打印 假 脱 机 守护 进程 的 同一 台 机 右上 运行 prit 命令 ， 
也 可 以 在 同一 个 网 络 中 的 任意 机 器 上 运行 它 。 我 们 只 需 配 置 
在 /etc/printer.conf 中 的 printserver 字段 即 可 ， 因 为 只 有 守护 进程 需要 知 
道 打 印 机 名 称 。 

安全 

拥有 超级 用 户 特 权 的 程序 可 能 让 计算 机 系统 受到 攻击 。 这 些 程 序 
通常 并 不 比 其 他 程序 更 脆弱 ， 但 是 被 攻破 时 将 导致 攻击 者 能 够 完全 访 
问 你 的 计算 机 系统 。 

本 章 中 的 打印 假 脱 机 守护 进程 拥有 超级 用 户 特 权 ， 在 这 个 例子 中 
能 够 将 一 个 特权 TCP 端 口号 绑 定 一 个 套 接 字 。 为 了 使 守护 进程 能 更 好 地 
抵御 攻击 ， 我 们 可 以 ; 

“按照 最 少 特权 的 原则 (8.11 $) 设计 守护 进程 。 我 们 获得 一 个 绑 
定 到 特权 端口 的 套 接 字 之 后 ， 可 以 将 守护 进程 的 用 户 ID 和 组 的 ID 更 改 
为 非 root (Alp) 。 所 有 用 于 存储 队列 中 打印 作业 的 文件 和 目录 的 拥有 
者 应 该 是 非特 权 用 户 。 如 有 果 们 攻击， 这 种 情况 下 攻击 者 只 能 通过 守 扩 
进程 访问 打印 子 系统 。 虽 然 这 仍然 是 一 个 隐患 ， 但 是 比 起 攻击 者 可 以 
完全 访问 系统 ， 其 危害 性 已 大 大 降低 了 。 

“审计 守护 进程 源 代 码 中 所 有 已 知 的 潜在 脆弱 性 漏洞 ， 如 缓冲 区 海 
出 o 

“对 不 期 望 或 者 可 疑 的 行为 做 日 志 ， 这 样 可 以 引起 管理 员 注 意 并 进 


一 步调 查 。 


21.5 源 代 码 


本 章 的 源 代 码 有 5 个 文件 ， 不 包括 在 前 面 章 世 中 所 用 的 一 些 公 共 库 
例 程 。 

ipp.h 包含 IPP 定 义 的 头 文件 。 

print.h 包含 公用 的 营 数 、 数 据 结构 定义 以 及 实用 工具 例 程 的 声明 
BIES 

util.c 用 于 两 个 程序 的 实用 工具 例 程 。 

用 于 打印 文件 的 命令 行程 序 C 代 码 。 

printd.c 用 于 打印 假 脱 机 守护 进程 的 C 代 码 。 我 们 按照 所 列 次 序 依 
KOATEN? 

首先 从 ipp.h 头 文件 开始 。 

print.c 

1 #ifndef IPP H 

2 #define IPP H3/* 

4 * Defines parts of the IPP protocol between the scheduler 

5 * and the printer. Based on RFC2911 and RFC2910. 

6 */ 

7/* 

8 * Status code classes. 

9 */ 

10 #define STATCLASS OK(x) ((x) >=0x0000 && (x) <= 
OxOOff) 

11 define STATCLASS INFO(x) ((x) >= 0x0100 && (x) <= 
Ox01ff) 

12 define STATCLASS_REDIR(x) ((x) >= 0x0300 && (x) <= 0x03ff) 

13 #define STATCLASS CLIERR(x) ((x) >= 0x0400 && (x) <= 
0x04ff) 


14 #define STATCLASS SRVERR(x) ((x) >= 0x0500 && (x) <= 


Ox05ff) 


*/ 


p 


* 


15 /* 

16 * Status codes. 

175 

18 #define STAT OK 0x0000 /* success */ 

19 #define STAT OK. ATTRIGN 0x0001 /* OK; some attrs ignored */ 
20 #define STAT OK. ATTRCON 0x0002 /* OK; some attrs conflicted 


21 #define STAT CLI BADREQ 0x0400 /* invalid client request */ 

22 #define STAT CLI FORBID 0x0401 /* request is forbidden */ 

23 #define STAT CLI NOAUTH 0x0402 /* authentication required */ 
24 define STAT CLI NOPERM 0x0403 /* client not authorized */ 

25 #define STAT CLI NOTPOS 0x0404 /* request not possible */ 

26 #define STAT CLI TIMOUT 0x0405 /* client too slow */ 

27 #define STAT CLI NOTEND 0x0406 /* no object found for URI */ 
28 #define STAT CLI OBJGONE 0x0407 /* object no longer available 


29 #define STAT CLI TOOBIG 0x0408 /* requested entity too big */ 
30 #define STAT CLI TOOLNG 0x0409 /* attribute value too large */ 
31 #define STAT CLI BADFMT 0x040a /* unsupported doc format */ 
32 #define STAT CLI NOTSUP 0x040b /* attributes not supported */ 
33 define STAT CLI NOSCHM 0x040c /* URI scheme not supported 


34 #define STAT CLI NOCHAR 0x040d /* charset not supported */ 
35 #define STAT_CLI_ATTRCON 0x040e /* attributes conflicted */ 


36 #define STAT CLI NOCOMP 0x040f /* compression not supported 
ei 

37 #define STAT CLI COMPERR 0x0410 /* data can't be 
decompressed */ 

38 #define STAT_CLI_FMTERR 0x0411 /* document format error */ 

39 #define STAT CLI ACCERR 0x0412 /* error accessing data */ 

[17-14] ipp.h 从 标准 的 ##fdef 开 始 ， 用 于 防止 同一 文件 被 包含 两 次 的 
普 误 。 然 后 定义 IPP 状 态 码 的 类 (参见 RFC 2911094137) ° 

[157-39] 定义 基于 RFC 2911 的 状态 码 ， 但 是 本 程序 不 使 用 ， 这 些 
状态 码 的 使 用 留 给 读者 作为 练习 (参见 习题 21.1) 。 

40 #define STAT_SRV_INTERN 0x0500 . /* unexpected 
internal error */ 

41 #define STAT SRV NOTSUP 0x0501  /* operation not 
supported */42 #define STAT SRV UNAVAIL  0x0502 /* service 
unavailable */ 

43 #define STAT SRV BADVER 0x0503  /* version not 
supported */ 

44 define STAT SRV DEVERR 0x0504 /* device error */ 

45 #define STAT SRV TMPERR 0x0505 /* temporary error */ 


iE 


46 "define STAT SRV. REJECT 0x0506 /* server not 
accepting jobs */47 #define STAT SRV TOOBUSY 0xx0507 /* server too 
busy */ 

48 #define STAT SRV. CANCEL 0x0508 /* job has been 


canceled */ 

49 #define STAT SRV NOMULTI 0x0509 /* multi-doc jobs 
unsupported */ 

50 /* 


51 * Operation IDs 
52 */ 


53 
54 
55 
56 
57 
58 
59 
60 
61 
62 
63 
64 
65 
66 
67 
68 


69 /* 


"define OP PRINT JOB 
"define OP PRINT URI 
"define OP VALIDATE JOB 
"define OP CREATE JOB 
#define OP SEND DOC 
"define OP SEND URI 
"define OP CANCEL JOB 
"define OP GET JOB. ATTR 
#define OP GET JOBS 


#define OP GET PRINTER, ATTR 


#define OP HOLD JOB 
#define OP RELEASE JOB 
#define OP RESTART JOB 


#define OP PAUSE PRINTER 
#define OP RESUME PRINTER 


#define OP PURGE JOBS 


70 * Attribute Tags. 
71 */ 


72 


#define TAG OPERATION_ATTR 


attributes tag */ 


73 
*/ 
74 


#define TAG_JOB_ATTR 


#define TAG_END_OF_ATTR 


attributes tag */ 


0x02 
0x03 
0x04 
0x05 
0x06 
0x07 
0x08 
0x09 
0x0a 


OxOb 


0x0c 
Ox0d 
UX0e 

0x10 


0x11 


0x12 


0x02 


0x01 /* operation 


/* job attributes tag 


0x03 /* end of 


75 #define TAG PRINTER, ATTR 0x04 /* printer attributes 
tag */ 

76 #define TAG UNSUPP ATTR 0x05  /* unsupported 
attributes tag */ 

[40~ 49] ZEE TE LIA fi © 0x500~ OxSft Fz ARS 88 FH IRA © REC 
2911 中 13.1.1 节 至 13.1.5 市 描述 了 所 有 的 状态 码 。 

[507-68] 接着 定义 各 种 操作 ID。IPP 中 定义 的 每 个 操作 有 一 个 ID 

(参见 RFC 2911 的 4.4.15 节 ) 。 在 本 例 中 ， 仅 用 到 打印 作业 操作 © 

[697-76] 属性 标志 限定 了 IPP 中 请 求 和 响应 报 文 的 属性 组 。 这 些 信 

定义 在 RFC 2910 的 3.5.1 节 ° 


77 /* 

78 * Value Tags. 

79 */ 

80 define TAG UNSUPPORTED 0x10  /* unsupported 
value */ 

81 #define TAG UNKNOWN 0x12  /* unknown 
value */ 

82 #define TAG NONE 0x13 /* no value */ 

83 #define TAG INTEGER 0x21 /* integer */ 

84 define TAG BOOLEAN 0x22 /* boolean */ 

85 define TAG ENUM 0x23 /* enumeration */ 

86 #define TAG OCTSTR 0x30 /* octetString */ 

87 #define TAG DATETIME 0x31 /* dateTime */ 

88 define TAG RESOLUTION 0x32 /* resolution */ 

89 #define TAG INTRANGE 0x33 /* rangeOfInteger 


*/ 


90 "define TAG. TEXTWLANG 0x35 /* 
textWithLanguage */ 

91 #define TAG_NAMEWLANG 0x36 /* 
nameWithLanguage */ 

92 #define TAG. TEXTWOLANG 0x41 /* 
textWithoutLanguage */ 

93 #define TAG NAMEWOLANG 0x42 p 
nameWithoutLanguage */ 

94 #define TAG KEYWORD 0x44 /* keyword */ 

95 #define TAG URI 0x45 /* URI */ 

96 #define TAG URISCHEME 0x46 /* uriScheme */ 

97 #define TAG CHARSET Ox47 /* charset */ 

98 #define TAG. NATULANG 0x48 Jm 


naturalLanguage */ 


99 


#define TAG MIMETYPE 0x49 pt 


mimeMediaType */ 


100 
101 
102 
103 
104 
105 
106 
107 
108 
109 


struct ipp hdr { 
int8 t major version; /* always 1 */ 
int8 t minor version; /* always 1 */ 
union { 
int16 t op; /* operation ID */ 
int16 t st; /* status */ 
} u; 
int32_t request_id; /* request ID */ 
char attr_group[1]; /* start of optional attributes group */ 


/* optional data follows */ 


110 }; 


111 #define operation u.op 

112 #define status u.st 

113 #endif /* IPP H */ 

[77-99] 值 标志 指示 每 个 属性 和 参数 的 格式 ， 由 RFC 2910853.5.2 
节 定 义 。[100~113] 定义 IPP 首 部 的 结构 。 请 求 报 文 与 响应 报 文 的 首部 
一 样 ， 除 了 请 求 中 的 操作 ID 被 啊 应 中 的 状态 码 代 替 。 在 头 文件 尾部 我 
们 用 #endif 来 匹配 文件 开始 的 ##fdef 。 

下 一 个 文件 是 printh 头 文件 。 

1 #ifndef PRINT H 

2 #define PRINT H 

Bu 

4 * Print server header file. 

5 */ 

6 #include <sys/socket.h> 


7 #include <arpa/inet.h> 
8 #include <netdb.h> 


9 #include <errno.h> 


10 #define CONFIG_FILE "/etc/printer.conf" 
11 #define SPOOLDIR "/var/spool/printer" 
12 #define JOBFILE "jobno" 

13 #define DATADIR "data" 

14 define REQDIR "reqs" 

15 £if defined(BSD) 

16 #define LPNAME "daemon" 
18 #define LPNAME "Ip" 

20 #define LPNAME "Ip" 


17 #elif defined(:MACOS) 


19 #else 

21 #endif 

[17-9] 在 这 个 头 文 件 中 包含 所 需要 的 所 有 头 文 件 。 应 用 程序 只 需 
简单 地 包含 printh， 而 不 需要 跟踪 所 有 的 头 文 件 依赖 关系 。 

[107-14] 定义 实现 所 需 的 文件 和 目录 。 包 含 打 印 守护 进程 和 网 络 
打印 机 主机 名 的 配置 文件 在 /etc/printer.conf 中 。 需 要 打印 的 文件 副本 在 
H 3X /var/spool/printer/data 中 ; 对 于 每 个 请 求 的 控制 信息 在 目 
3K /var/spool/printer/reqs 中 。 包 合 下 一 个 作业 编号 的 文件 
是 /var/spool/printer/jobno ° 

目录 必须 由 管理 员 创 建 并 且 由 运行 打印 守护 进程 的 账户 所 有 。 如 
果 这 些 目 录 不 存在 ， 守 护 进 程 也 不 会 创建 这 些 目录 ， 因 为 守护 进程 需 
要 root 权限 来 创建 /var/spool 中 的 目录 。 我 们 的 设计 初衷 是 当 以 root 权 限 
运行 时 ， 尽 量 让 守护 进程 少 做 一 些 事情 ， 以 减少 产生 安全 漏洞 的 可 

[157-21] 接着 定义 运行 打印 守护 进程 的 账户 名 。 在 Linux 和 Solaris 
中 ， 这 个 账户 名 是 jp。 在 Mac OS XF, IKA Æp * FreeBSD2X/8 WN 
打印 守护 进程 定义 单独 的 账户 ， 所 以 我 们 使 用 为 系统 守护 进程 傈 留 的 
账户 。 

22 #define FILENMSZ 64 

23 #define FILEPERM (S IRUSR|S IWUSR) 

24 define USERNM MAX 64 

25 #define JOBNM MAX 256 

26 define MSGLEN MAX 512 

27 #ifndef HOST NAME MAX 

28 #define HOST NAME MAX 256 

29 #endif 

30 #define IPP PORT 631 


unb 
GG 


31 #define QLEN 10 


32 #define IBUFSZ 512  /* IPP header buffer size */ 

33 define HBUFSZ 512 /* HTTP header buffer size */ 
34 #define IOBUFSZ 8192 /* data buffer size */ 

35 #ifndef ETIME 

36 #define ETIME ETIMEDOUT 

37 #endif 


38 extern int getaddrlist(const char *, const char *, 

39 struct addrinfo **); 

AO extern char *get_printserver(void); 

41 extern struct addrinfo *get_printaddr(void); 

42 extern ssize t tread(int, void *, size t, unsigned int); 

43 extern ssize t treadn(int, void *, size t, unsigned int); 

44 extern int connect retry(int, int, int, const struct sockaddr *, 

45 socklen t); 

47 int); 

46 extern int initserver(int, const struct sockaddr *, socklen t, 

[227-34] 接 下 来 定义 限制 和 常量 。FILEPERM 是 创建 要 打印 的 文件 
副本 使 用 的 权限 。 这 个 权限 是 被 限制 的 ， 因 为 我 们 不 希望 普通 用 户 在 
等 竺 打印 时 能 够 读 取 他 人 的 文件 。 我 们 定义 HOST _ NAME_MAX 作 为 
用 sysconf 不 能 够 确定 系统 的 限制 时 能 够 文 持 的 最 大 的 主机 名 。 

IPP 被 定义 为 使 用 端口 631。QLEN 是 传递 给 listen 的 backlog 参 数 

(具体 细 市 见 16.4 节 ) 9 [35737] 一 些 平 台 没有 定义 错误 码 ETIME， 
此 另外 定义 一 个 错误 码 ， 使 得 在 这 些 系统 上 有 意义 。 当 读 超 时 时 ， 返 
回 这 个 错误 码 《我 们 不 和 希望 在 从 套 接 字 读 的 时 候 服 务 器 无 限期 地 阻 
dE) © 


[38-47] 接着 ， 定 义 所 有 包含 在 utilc 中 的 公共 例 程 〈 稍 后 将 分 析 
这 些 例 程 ) 。 注 意 ， 图 16-11 F H3 connect retry K žk 4i K] 16-22 F HY 
initserver- HAUL A ES fEutil.cH? 。 


48 /* 

49 * Structure describing a print request. 

50 */ 

51 struct printreq 1 

52 uint32_t size; /* size in bytes */ 

53 uint32 t flags; /* see below */ 

54 char usernm[USERNM. MAX]; /* user's name */ 

55 char jobnm[JOBNM. MAX]; /* job's name */ 

56 }; 

D7 /* 

58 * Request flags. 

39 */ 

60 define PR. TEXT 0x01 /* treat file as plain 
text */ 

61 /* 

62 * The response from the spooling daemon to the print command. 

63 */ 

64 struct printresp 1 

65 uint32 t retcode; /* Q-success, !O-error 
code */ 

66 uint32 t jobid; /* job ID */ 

67 char msg[MSGLEN MAX]; /* error message */ 

68 }; 


69 #endif /* _PRINT_H */ 


[48~69] printreq 结 构 和 printresp 结 构 定 义 了 print 程 序 和 打印 假 脱 机 
守护 进程 之 间 的 协议 。print 程 序 发送 printreq 结 构 到 打印 假 脱 机 守护 进 
程 ， 该 结构 定义 了 作业 大 小 (ELSE DON ERE) 、 作 业 性 质 、 用 户 名 和 
作业 和 名。 打印 假 脱 机 守护 进程 用 printresp 结 构 回 应 ， 该 结构 包括 返回 
码 、 作 业 ID 和 错误 消息 《如 果 请 求 失败 ) 

PR_TEXT 作 业 性 质 表明 要 打印 的 文件 只 能 被 视 为 纯 文本 (而 不 是 
PostScript) 。 我 们 为 所 有 的 标志 定义 一 个 掩 码 而 非 对 每 个 标志 定义 一 
个 独立 的 字段 。 尽 管 目前 只 定义 了 一 个 标志 值 ， 将 来 还 可 以 增加 更 多 
性 质 来 扩展 这 个 协议 。 例 如 ， 我 们 可 以 在 增加 一 个 标志 位 用 来 请 求 双 
面 打 印 。 不 需要 改变 结构 的 大 小 就 可 以 有 31 个 额外 的 标志 位 的 空间 。 
改变 结构 的 大 小 意味 着 可 能 会 引入 客户 端 和 服务 器 的 兼容 性 问题 ， 除 
非 对 两 边 同 时 更 新 。 另 一 个 可 选 方案 吏 是 增加 一 个 报 文 版 本 号 ， 以 人 允 
许 不 同 版 本 的 结构 有 所 改变 。 

注意 ， 对 协议 结构 中 的 所 有 整数 显 式 地 定义 了 一 个 长 度 ， 这 可 以 
在 客户 端 与 服务 器 的 整数 长 度 不 同时 避免 错位 的 结构 元 素 。 

下 一 个 文件 我 们 考察 util.c， 该 文件 包含 实用 工具 例 程 。 

1 #include "apue.h" 


2 #include "print.h" 

3 #include <ctype.h> 

4 #include <sys/select.h> 

5 #define MAXCFGLINE 512 

6 #define MAXKWLEN 16 

7 #define MAXFMTLEN 16 

8 /* 

9 * Get the address list for the given host and service and 

10 * return through ailistpp. Returns 0 on success or an error 


11 * code on failure. Note that we do not set errno if we 


12 * encounter an error. 

135 

14 * LOCKING: none. 

15 */ 

16 int 

17 getaddrlist(const char *host, const char *service, 

18 struct addrinfo **ailistpp) 

19 { 

20 int err; 

21 struct addrinfo hint; 

22 hint.ai_flags = AI CANONNAME; 

23 hint.ai_family = AF INET; 

24 hint.ai_socktype = SOCK_STREAM; 

25 hint.ai_protocol = 0; 

26 hint.ai_addrlen = 0; 

27 hintai canonname = NULL; 

28 hint.ai_addr = NULL; 

29 hint.ai_next = NULL; 

30 err = getaddrinfo(host, service, &hint, ailistpp); 

31 return(err); 

32 } 

[1~7] 首先 定义 了 这 个 文件 中 函数 中 的 限制 。MAXCFGLINE 是 打 
印 机 配置 文件 的 行 的 最 大 长 度 、MAXKWLEN 是 配置 文件 中 关键 字 的 
最 大 长 度 、MAXFMTLEN 是 传 给 sscanf 的 格式 化 字符 串 的 最 大 长 度 。 

[87-32] 第 一 个 函数 是 getaddrlist， 是 getaddrinfo (16.3.3 节 ) 的 封 
法 ， 因 为 我 们 常常 用 同样 的 结构 来 调用 getaddrinfo。 注 意 ， 在 这 个 函数 
中 不 需要 互 斥 锁 。 每 个 函数 前 面 的 LOCKING 注释 是 用 于 多 线程 锁定 


的 文档 编写 。 这 一 注释 列 出 了 可 能 的 关于 锁 的 假设 ， 告 知 该 函数 所 需 
要 获得 或 释放 的 锁 ， 并 告知 调用 这 个 函数 所 需要 持 有 的 锁 。 

33 /* 

34 * Given a keyword, scan the configuration file for a match 

35 * and return the string value corresponding to the keyword. 

36 * 

37 * LOCKING: none. 

38 */ 

39 static char * 


40 scan_configfile(char *keyword) 


41 { 

42 int n, match; 

43 FILE "fp; 

44 char keybuf MAXKWLEN|], 
pattern MAXFMTLEN]; 

45 char lin[MAXCFGLINE]; 


46 static char valbuf| € MAXCFGLINE ]; 

47 if ((fp = fopen(CONFIG FILE, "r")) == NULL) 

48 log. sys("can't open 96s", CONFIG. FILE); 

49 sprintf(pattern, "%%%ds %%%ds", MAXKWLEN-1, 
MAXCFGLINE-1); 

50 match = 0; 

51 while (fgets(line, MAXCFGLINE, fp) != NULL) { 


52 n = sscanf(line, pattern, keybuf, valbuf); 
53 if (n == 2 && strcmp(keyword, keybuf) == 0) 1 
54 match - 1; 


55 break; 


56 } 

57 } 

58 fclose(fp); 

59 if (match != 0) 


60 return(valbuf); 
61 else 

62 return(NULL); 
63 } 


[33 — 46] scan_configfile 芳 数 搜索 打印 机 配置 文件 中 指定 的 天 键 
字 。 

[47~ 63] 以 读 方 式 打开 配置 文件 ， 根 据 搜 索 模 式 建立 格式 字符 
串 。 符 号 %9%%ds 建立 一 个 格式 指示 器 来 限定 字符 串 长 度 ， 这 样 在 栈 中 
API FF BAY Bee AS oda Ho FEDORA URE T, HHHH 
BAA A SEAR, WARE), MARES SRS 
AF FR EE o WARES BI — 1 VeRO Be BEE CP, NPBA SE RE RAC 
件 。 如 果 天 键 字 匹配 ， 则 返回 一 个 指 同 包含 关键 字 后 面 的 字符 串 的 组 
冲 区 的 指针 ;否则 返回 NULL。 返 回 的 字符 串 存放 在 静态 缓冲 区 

(valbuf) 中 ， 该 缓冲 区 会 被 紧 接 的 调用 覆盖 。 因 此 ，scan_configfile 

不 能 用 于 多 线程 程序 ， 除 非 能 够 小 心地 避免 同时 有 多 个 线程 调用 它 。 

64 /* 

65 * Return the host name running the print server or NULL on error. 

66 * 

67 * LOCKING: none. 

68 */ 

69 char * 

70 get. printserver(void)71 1 


72 return(scan configfile("printserver")); 


73 } 

74 [* 

75 * Return the address of the network printer or NULL on error. 
76 * 

77 * LOCKING: none. 

78 */ 

79 struct addrinfo * 


80 get printaddr(void)81 1 


82 int err; 

83 char *p; 

84 struct addrinfo *ailist; 

85 if ((p = scan_configfile("printer")) != NULL) { 

86 if ((err = getaddrlist(p, "ipp", &ailist)) != 0) { 

87 log msg("no address information for 96s", p); 
88 return(NULL); 

89 } 

90 return(ailist); 

91 } 


92 log_msg("no printer address specified"); 

93 return(NULL); 

94 } 

[64~ 73] get_printserver DU — ARKAE A, Ea 
调用 scan_configfile 找 到 运行 打印 假 脱 机 守护 进程 的 计算 机 系统 名 。 

[74-94] 使 用 get_printaddr 芳 数 找到 网 络 打印 机 的 地 址 。 除 了 通过 
配置 文件 中 的 打印 机 名 找到 相应 的 网 络 地 址 之 外 ， 该 函数 与 前 面 的 函 
数 类 似 。 


get_printserver 和 get_printaddr 均 调用 scan_configfile。 如 采 不 能 打开 
打印 机 配置 文件 ，scan_configfile 就 调用 log_sys 打 印 出 销 消 息 并 退出 。 
尽管 get_printserver 由 客户 端 命令 调用 ，get_printaddr 由 守护 进程 程序 调 
用 ， 但 两 者 均 可 调用 log_sys， 因 为 通过 设置 一 个 全 局 变量 可 以 安排 日 
志 贺 数 将 其 打印 到 标准 错误 ， 而 不 是 输出 到 日 志文 件 。 

95 /* 


96 * "Timed" read - timout specifies the # of seconds to wait before 


97 * giving up (5th argument to select controls how long to wait for 
98 * data to be readable). Returns £ of bytes read or -1 on error. 

99 * 

100 * LOCKING: none. 

101 */ 

102 ssize_t 


103 tread(int fd, void *buf, size_t nbytes, unsigned int timout) 


104 { 

105 int nfds; 
106 fd_set readfds; 
107 struct timeval tv; 

108 tv.tv sec = timout; 


109 tv.tv usec - 0; 

110 FD ZERO(&readfds); 

111 FD SET(fd, &readfds); 

112 nfds = select(fd+1, &readfds, NULL, NULL, &tv); 
113 if (nfds <= 0) { 

114 if (nfds == 0) 

115 errno = ETIME; 

116 return(-1); 


117 ) 

118 return(read(fd, buf, nbytes)); 

119 } 

[95 —- 107] tread 的 函数 读 取 指定 的 字 节 数 ， 在 放弃 以 前 至 多 阻塞 
timout 秒 。 当 我 们 从 一 个 套 搂 字 或 一 个 管道 读数 据 时 这 个 函数 很 有 用 。 
如 有 条 在 指定 的 时 间 期 限 内 没有 接收 数据 ， 返 回 -1 并 将 errno KY 
ETIME ° 如果 在 时 间 期 限 内 有 数据 可 用 ， 返 回 最 多 nbytes 字 市 的 数据 ， 
但 是 如 果 数 据 没有 及 时 到 达 ， 我 们 可 以 返回 比 要 求 的 少 的 数据 。 我 们 
用 tread 在 打印 假 脱 机 守护 进程 上 防止 拒绝 服务 攻击 。 一 个 恶意 用 户 可 
能 重复 尝试 连接 到 守护 进程 而 不 发 送 数据 ， 只 是 为 了 阻止 其 他 用 户 提 
交 打 印 作 业 。 通 过 一 个 合理 时 间 内 放弃 的 方式 ， 我 们 防止 这 种 情况 发 
生 。 其 巧妙 之 处 在 于 选择 一 个 合理 的 超时 值 ， 当 系统 负载 比较 低 和 任 
务 化 费 更 长 时 间 时 ， 该 值 足够 大 能 够 防止 过 早 天 折 。 如 有 果 我 们 选择 的 
值 太 大 ， 通 过 允许 守护 进程 程序 消耗 太 多 资源 去 处 理 挂 起 请 求 ， 可 能 
导致 拒绝 服务 攻击 。 

[108~119] 使 用 select 等 待 指定 的 文件 描述 符 可 读 。 如 采 在 要 读 取 
的 数据 可 用 之 前 超时 ， select 返 回 9， 这 种 情况 将 errno 设 为 ETIME。 如 
条 Select 失败 或 超时 ， 返 回 -1; 否则 返回 任何 可 用 数据 。 

120 /* 


121 * "Timed" read - timout specifies the number of seconds to wait 


122 * per read call before giving up, but read exactly nbytes bytes. 
123 * Returns number of bytes read or -1 on error. 

124 * 

125 * LOCKING: none. 

126 */ 

127 ssize t 


128 treadn(int fd, void *buf, size t nbytes, unsigned int timout) 


129 { 
130 
131 
132 
133 
134 
135 
136 
137 
138 
so far */ 
139 
140 
141 
142 
143 
145 
146 ) 


size t nleft; 

ssize t nread; 

nleft = nbytes; 

while (nleft > 0) { 

if ((nread = tread(fd, buf, nleft, timout)) < 0) { 
if (nleft == nbytes) 
return(-1); /* error, return -1 */ 

else 


break; /* error, return amount read 


} else if (nread == 0) 1 
break; /* EOF */ 
} 
nleft -= nread; 
buf += nread;144 } 


return(nbytes - nleft); /* return >= 0 */ 


[120—146] 还 提供 了 tread 的 变 体 treadn， 它 仪 读 取 指 定 的 字 节 数 。 
这 和 14.7 广 中 描述 的 readn 类 似 ， 但 是 附加 了 一 个 超时 参数 。 

为 了 正好 读 取 nbytes 字 下 ， 必 须 进 行 多 次 read 调 用 。 其 困难 之 处 在 
于 尝试 将 单个 超时 值 应 用 到 多 个 read 调 用 。 这 里 不 想 用 曾 钟 ， 因 为 在 多 
线程 应 用 中 信和 号 会 变 乱 ， 也 不 能 依赖 系统 根据 select 的 返回 更 新 timeval 
结构 ， 以 指示 剩余 的 时 间 ， 因 为 许多 平台 不 文 持 这 个 〈14.5.1 节 ) ° 
此 ， 这 种 情况 需要 折 中 并 定义 一 个 超时 值 应 用 到 单独 的 read 调 用 。 它 限 
制 循环 中 每 次 迭代 的 等 每 时 间 ， 而 不 是 限制 总 的 等 待 时 间 。 


li — 


总 等 待 的 最 大 时 间 由 nbytesxtimout 秒 限定 〈 最 坏 情况 下 ， 一 次 仅 接 
SFT) e 
用 nleft 记录 要 该 取 的 剩余 字 世 数 。 如 果 tread ZEE EMA 


中 已 经 接收 到 数据 ， 则 停止 while 循 环 并 返回 读 取 的 字 节 数 ， 否 则 返回 


一 1 。 


接 下 来 是 用 于 提交 打印 作业 的 命令 程序 。C 源 代码 文件 是 print.c。 
1/* 

2 * The client command for printing documents. Opens the file 
3 * and sends it to the printer spooling daemon. Usage: 

4 * print [-t] filename 

5 */ 

6 #include "apue.h" 

7 #include "print.h" 

8 #include <fcntl.h> 

9 #include <pwd.h> 

10 /* 

11 * Needed for logging funtions. 

12 */ 

13 int log to stderr = 1; 


14 void submit. file(int, int, const char *, size t, int); 


15 int 

16 main(int argc, char *argv[]) 

17 { 

18 int fd, sockfd, err, text, c; 
19 struct stat sbuf; 

20 char *host; 


21 struct addrinfo ^ *ailist, *aip; 


22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 


err = 0; 
text = 0; 
while ((c = getopt(argc, argv, "t")) != -1) 1 
switch (c) 1 
case 't': 
text = 1; 
break; 


case '?': 


} 


[17-14] 需要 定义 一 个 log_to_stderr 整 数 ， 通 过 这 个 整数 能 够 使 用 库 
HAS) A EB o WRI ASE 0 值 ， 错 误 消 息 将 被 送 到 一 个 标准 
错误 流 而 非 日 志文 件 中 。 尽 管 在 print.c 中 没有 使 用 任何 日 志 函 数 ， 但 将 
util.o 链 接 到 printo 构 建 了 一 个 可 执行 的 print 命 令 ， 并 且 util.c 包 含 用 于 用 
户 命令 行程 序 和 守护 进程 的 函数 。 

[157-33] 文 持 一 个 选项 ， 即 -t， 强 行使 文件 按照 文本 格式 打印 (而 
不 是 其 他 格式 ， 如 PostScript 格 式 ) 。 使 用 getopt 函 数 来 处 理 命令 选 项 。 


34 
35 
36 
37 
38 
39 
40 
41 


if (err || (optind != argc - 1)) 
err quit("usage: print [-t] filename"); 
if ((fd = open(argv[optind], O RDONLY)) « 0) 
err sys("print: can't open 96s", argv[optind ]); 
if (fstat(fd, &sbuf) « 0) 
err sys("print: can't stat 96s", argv[optind |); 
if (I5 ISREG(sbuf.st mode)) 


err quit("print: 96s must be a regular file", argv[optind]); 


42 p 

44 */ 

43 * Get the hostname of the host acting as the print server. 
45 if ((host = get printserver()) == NULL) 


46 err quit("print: no print server defined"); 
47 if ((err = getaddrlist(host, "print", &ailist)) != 0) 
48 err quit("print: getaddrinfo error: 96s", gai strerror(err)); 


49 for (aip = ailist; aip !- NULL; aip = aip-^ai next) { 


50 if ((sfd = connect retry(AF INET, SOCK_ STREAM, 0, 
51 aip->ai_addr, aip->ai_addrlen)) < 0) 1 
52 err = errno; 


[34~41] 4 getopt 处 理 完 命令 选项 ， 将 变量 optind 设 为 指 癌 第 一 个 
非 选 项 参数 的 下 标 。 

如 果 这 是 一 个 值 而 非 最 后 一 个 参数 的 下 标 ， 那 么 说 明 它 是 错误 的 
参数 个 数 (只 支持 一 个 非 选 项 参数 ) 。 错 误 处 理 包括 : 检查 是 否 能 够 
打开 要 打印 的 文件 ， 检查 是 否 是 一 个 常规 文件 (而 不 是 一 个 目录 或 者 
其 他 类 型 的 文件 ) 。 

[42 —48] 通过 调用 util.c 中 的 get_printserver 芳 数 取 得 打印 假 脱 机 守 
护 进程 名 ， 并 且 调 用 getaddrlist (也 在 util.c 中 ) 将 主机 名 转换 成 一 个 网 
络 地 址 。 

注意 ， 指 定 服务 名 为 “print*。 在 系统 上 安装 打印 假 脱 机 守护 进程 
上 时， 需要 确保 /etc/services 《或 等 价 的 数据 库 ) 有 打印 机 服务 的 条 目 。 
当 为 守护 进程 选择 一 个 端口 时 ， 最 好 选择 特权 端口 ， 以 防止 恶意 用 户 
程序 假装 成 一 个 打印 假 脱 机 守护 进程 ， 而 实际 上 是 要 偷 取 打 印 文件 的 
副本 。 这 意味 着 端口 号 应 小 于 1 024 (回忆 16.3.4 节 ) ， 并 且 和 守护 进程 运 
行 时 必须 具有 超级 用 户 特 权 以 便 能 够 绑 定 一 个 保留 端口 。 


[49-52] 使 用 getaddrinfo 返 回 的 地 址 列表 来 党 试 连 接 到 守护 进程 ， 
然后 使 用 能 够 连接 的 第 一 个 地 址 发 送 文件 到 守护 进程 。 
53 } else { 


54 submit_file(fd, sfd, argv[optind], sbuf.st_size, text); 
55 exit(0); 

56 } 

57 } 

58 err exit(err, "print: can't contact 96s", host); 
59 } 

60 /* 

61 * Send a file to the printer daemon. 

62 */ 

63 void 

64 submit. file(int fd, int sockfd, const char *fname, size t nbytes, 
65 int text) 

66 ( 

67 int nr, nw, len; 

68 struct passwd *pwd; 

69 struct printreq req; 

70 struct printresp res; 

71 char buf[IOBUFSZ]; 

72 /* 

73 * First build the header. 

74 g 

75 if ((pwd = getpwuid(geteuid())) == NULL) { 
76 strcpy(req.usernm, "unknown"); 


77 } else { 


78 strncpy(req.usernm, pwd-^pw name, USERNM MAX- 
1); 

79 req.usernm[USERNM_MAX-1] = ^05; 

80 } 

[537-59] 如 采 能 够 连接 到 打印 假 脱 机 守护 进程 ， 则 调用 submit_file 
将 要 打印 的 文件 传送 到 守护 进程 ， 然 后 用 返回 值 0 表示 成 功 后 退出 。 如 
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表示 失败 后 退出 (附录 B 包 含 了 err_exit 的 源 代码 和 其 他 错误 例 程 ) 

[60—-80] submit_file 发 送 打 印 机 请 求 到 守护 进程 并 读 取 啊 应 消息 。 
首先 ， 建 立 printreq 请 求 头 。 使 用 geteuid 来 获得 调用 者 的 有 效用 户 ID 并 
将 其 传 给 getpwuid 以 便 查 找 在 系统 口令 文件 中 的 用 户 。 将 该 用 户 名 复制 
到 请 求 头 。 如 果 不 能 识别 用 户 ， 在 请 求 首部 中 使 用 字符 串 "unknown"。 
从 口令 文件 中 复制 用 户 名 时 ， 为 避免 写 超出 请 求 首 部 的 用 户 名 缓冲 
区 ， 可 以 使 用 strncpy。 如 果 用 户 名 比 缓冲 区 长 ，strncpy 个 会 在 缓冲 区 
中 存储 终止 null 字 节 ， 因 此 我 们 需要 上 自己 来 做 。 

81 req.size = htonl(nbytes); 

82 if (text) 


83 req.flags = htonl(PR. TEXT); 

84 else 

85 req.flags = 0; 

86 if ((len = strlen(fname)) >= JOBNM MAX) { 

87 ft 

88 * Truncate the filename (+-5 accounts for the leading 
89 * four characters and the terminating null). 

90 */ 


91 strcpy(req.jobnm, "... "); 


92 strncat(req.jobnm, &fname[len-JOBNM_MAX+5], 
JOBNM_MAX-5); 


93 } else { 

94 strcpy(req.jobnm, fname); 

95 } 

96 /* 

97 * Send the header to the server. 

98 */ 

99 nw = writen(sockfd, &req, sizeof(struct printreq)); 


100 if (nw != sizeof(struct printreq)) { 


101 if (nw < 0) 

102 err_sys("can’t write to print server"); 

103 else 

104 err_quit("short write (%d/%d) to print server", 
105 nw, sizeof(struct printreq)); 

106 } 


[817-95] 将 要 打印 的 文件 转 成 网 络 字 节 序 后 ， 将 其 文件 长 度 保存 
在 请 求 首部 。 如 果 文 件 按 纯 文本 格式 打印 ， 在 请 求 首部 保存 PR_TEXT 
标志 。 通 过 将 这 些 整数 转化 成 网 络 字 节 序 ， 可 以 在 打印 假 脱 机 守护 进 
程 在 其 他 计算 机 系统 运行 的 同时 在 客户 端 系统 上 运行 print 命 令 。 那 
么 ， 即 便 这 些 系统 使 用 不 同 字 节 序 的 处 理 器 ， 这 些 命令 仍 可 运行 GE 
16.3.1 节 讨论 过 字 节 序 ) 

将 作业 名 设 为 要 打印 的 文件 名 。 如 果 作 业 名 的 长 度 超出 了 报 文 所 
能 容纳 的 作业 名 字段 长 度 ， 那 么 仅 复 制 可 容纳 的 作业 名 的 最 后 部 分 。 
这 样 就 有 效 地 将 作业 名 的 开头 部 分 截 去 ， 并 代入 省 略 符 ， 以 表示 该 字 
段 还 有 更 多 的 字符 。 


[96~ 106] 然后 使 用 writen 将 请 求 头 发 送 到 守护 进程 (回忆 一 下 我 
们 兽 在 图 14-24 中 介绍 过 的 writen 函 数 ) 。writen 函 数 使 用 多 个 write 调用 
来 传输 指定 数量 的 数据 。 如 果 写 入 失败 或 者 传输 少 于 期 望 的 数据 ， 将 
打印 错误 消 居 然后 退出 。 


107 pt 

108 * Now send the file. 

109 */ 

110 while ((nr = read(fd, buf, IOBUFSZ)) != 0) { 

111 nw = writen(sockfd, buf, nr); 

112 if (nw != nr) ( 

113 if (nw « 0) 

114 err sys("can't write to print server"); 
115 else 

116 err quit("short write (96d/96d) to print server", 
117 nW, nr); 

118 j 

119 j 

120 /* 

121 * Read the response. 

122 */ 

123 if ((nr = readn(sockfd, &res, sizeof(struct printresp))) != 
124 sizeof(struct printresp)) 

125 err sys("can't read response from server"); 
126 if (res.retcode != 0) ( 

127 printf("rejected: %s\n", res.msg); 

128 exit(1); 


129 } else ( 


130 printf("job ID %ld\n", (long)ntohl(res.jobid)); 

131 } 

132 } 

[107~119] 将 首部 发 送 到 守护 进程 后 ， 发 送 要 打印 的 文件 。 同 时 读 
取 文 件 的 IOBUFSZ 字 节 并 用 writen 发 送 数据 到 守护 进程 。 如 果 写 失败 
或 者 写 少 了 ， 那 么 就 打印 错误 信息 并 退出 。 

[1207-132] 把 要 打印 的 文件 发 送 给 守护 进程 后 ， 读 取 守 护 进程 的 
响应 数据 。 如 果 请 求 失 败 ， 返 回 码 (retcode) 为 非 零 值 ， 并 且 将 响应 
中 的 本 文 形式 的 错误 信息 打印 出 来 。 如 果 请 求 成 功 ， 将 打印 作业 ID， 
用 户 此 后 可 以 使 用 此 ID 引用 该 请 求 。 (我 们 将 写 一 个 命令 取消 一 个 挂 
起 的 打印 请 求 留 作 练习 ;作业 ID 可 以 用 于 取消 作业 请 求 ， 其 作用 是 从 
打印 队列 中 识别 要 删除 的 作业 ， 参 见习 题 21.5) 。 当 submin_file 返 回 到 
main 函 数 时 ， 退 出 ， 表 了 明 请 求 成 功 。 

注意 ， 一 个 成 功 的 守护 进程 响应 并 不 意味 着 打印 机 可 以 打印 该 文 
件 ， 仅 仅 意味 着 守护 进程 成 功 地 将 其 加 入 到 打印 作业 队列 。 

现在 print 命 令 已 经 完全 了 解 过 了 。 我 们 要 看 的 最 后 一 个 C 源 代码 文 
件 是 打印 假 脱 机 守护 进程 。 

1 /* 

2 * Print server daemon. 

3 */ 

4 #include "apue.h" 

5 #include <fcntl.h> 


6 #include <dirent.h> 


7 #include <ctype.h> 
8 #include <pwd.h> 
9 #include <pthread.h> 


10 #include <strings.h> 


11 #include <sys/select.h> 

12 #include <sys/uio.h> 

13 #include "print.h" 

14 #include "ipp.h" 

15 /* 

16 * These are for the HTTP response from the printer. 
17 */ 

18 #define HTTP_INFO(x) ((x) >= 100 && (x) <= 199) 
19 #define HTTP_SUCCESS(x) ((x) >= 200 && (x) <= 299) 
20 /* 

21 * Describes a print job. 

22 */ 

23 struct job { 


24 struct job *next; /* next in list */ 

25 struct job *prev; /* previous in list */ 

26 long jobid; /* job ID */ 

27 struct printreq req; /* copy of print request */ 
28 }; 

29 /* 


30 * Describes a thread processing a client request. 
31 */ 


32 struct worker_thread { 


33 struct worker thread  *next; /* next in list */ 

34 struct worker thread  *prev; /* previous in list */ 
35 pthread t tid; /* thread ID */ 
36 int sockfd;  /* socket */ 


37 }; 


[17-19] 打印 假 脱 机 守护 进程 包括 前 面 看 到 的 IPP 头 文件 ， 因 为 守护 
进程 需要 用 这 个 协议 与 打印 机 通信 。HTTP_INFO 和 HTTP_SUCCESS 宏 
定义 了 HTTP 请 求 的 状态 (IPP 建 立 在 HTTP 之 上 ) 。RFC 26165810 5 4E 
义 了 HTTP 状 态 码 。 

[20 — 37] 假 脱 机 守护 进程 使 用 job 和 worker_thread 结 构 来 跟踪 相应 
的 打印 作业 和 接受 打印 请 求 的 线程 。 

38 /* 

39 * Needed for logging. 

40 */ 

41 intlog to stderr = 0; 

42 /* 

43 * Printer-related stuff. 

44 */ 

45 struct addrinfo *printer; 

46 char *printer name; 

47 pthread mutex t configlock = 
PTHREAD MUTEX. INITIALIZER; 

48 int reread; 

49 /* 

50 * Thread-related stuff. 

51 */ 

52 struct worker_thread *workers; 

53 pthread_mutex_t workerlock = 
PTHREAD_MUTEX_INITIALIZER; 

54  sigset_t mask; 

55 /* 

56 * Job-related stuff. 


D7 */ 

58 struct job *jobhead, *jobtail; 

59 int jobfd; 

[38-41] 日 志 函 数 需 要 定义 log_to_stderr 变 量 ， 并 且 将 其 设 为 0， 将 
日 志 消 恩 发 送 到 系统 日 志 而 不 是 标准 错误 。 在 print.c 中 ， 即 使 在 用 户 
命令 中 不 使 用 日 志 ， 也 定义 log_to_stderr 并 将 其 设置 为 1。 如 果 将 实用 
工具 函数 拆 分 为 两 个 独立 的 文件 : 一 个 用 于 服务 器， 另 一 个 用 于 客户 
端 命令 ， 则 可 以 避免 这 种 情况 。 

[42~ 48] 使 用 全 局 指针 变量 printer 来 保存 打印 机 的 网 络 地 址 。 在 
printer_name 中 保存 打印 机 的 主机 名 。configlock 用 于 防止 访问 reread 变 
量 ， 该 变量 用 来 表示 守护 进程 需要 再 次 读 取 配 置 文件 ， 原 因 可 能 是 管 
理 员 改变 了 打印 机 网 络 地 址 。 

[497-54] 接着 ， 定 义 与 线程 相关 的 变量 。 使 用 workers 作 为 双 辣 链 
表 的 头 部 ， 该 表 用 于 接收 来 自 客户 端的 文件 。 采 用 workerlock 互 斤 量 来 
TRY AG 9 SBÓ£maskH TREE fER [55-59] 对 于 挂 起 作业 的 
链表 ， 定 义 jobhead 为 表 头 ，jobtail 为 表 尾 。 该 表 也 是 双向 链表 ， 但 是 需 
要 将 作业 加 入 到 表 尾 ， 所 以 需要 一 个 指针 来 记 住 表 尾 。 人 至 于 表 中 工作 
者 线程 的 顺序 是 无 关 紧 要 的 。 因 此 可 以 将 它们 加 入 到 表 头 而 不 需要 记 
住 尾 指针 。jobfd 是 作业 文件 的 文件 描述 符 。 


60 int32t nextjob; 


61 pthread mutex t joblock = 
PTHREAD_MUTEX_INITIALIZER; 

62 pthread_cond_t jobwait = 
PTHREAD_COND_INITIALIZER; 

63 /* 

64 * Function prototypes. 

65 */ 


66 void init request(void); 


67 void init printer(void); 

68 void update jobno(void); 

69 int32 t get newjobno(void); 

70 void add job(struct printreq *, int32 t); 
71 void replace job(struct job *); 

72 void remove job(struct job *); 

73 void build qonstart(void); 

74 void *client_thread(void *); 

75 void *printer thread(void *); 

76 void *signal thread(void *); 

77 ssize_t readmore(int, char **, int, int *); 
78 int printer status(int, struct job *); 
79 void add worker(pthread t, int); 

80 void kill workers(void); 

81 void client cleanup(void *); 

82 /* 


83 * Main print server thread. Accepts connect requests from 
84 * clients and spawns additional threads to service requests. 
85 * 

86 * LOCKING: none. 


87 */ 

88 int 

89 main(int argc, char *argv[]) 
90 { 

91 pthread t tid; 


92 struct addrinfo *ailist, *aip; 


0) 


93 
94 
95 
96 
97 


int sockfd, err, i, n, maxfd; 
char *host; 

fd_set rendezvous, rset; 
struct sigaction sa; 


struct passwd *pwdp; 


[60—-62] nextjob 是 接收 的 下 一 个 打印 作业 的 ID。 互 不 量 joblock 保 
护 作 业 表 ， 同 时 还 有 jobwait 代 表 的 条 件 变 量 。 

[637-81] 声明 此 文件 中 所 有 余下 的 函数 的 原型 。 提 前 做 好 这 些 工 
作 可 以 使 得 在 文件 中 放置 函数 时 不 用 担心 函数 调用 的 顺序 。 

[827-97] 打印 假 脱 机 守护 进程 的 main 函数 执行 两 个 任务 : 初始 化 
守护 进程 然后 处 理 来 自 客户 端的 连接 请 求 。 


98 

99 

100 
101 
102 
103 
104 
105 
106 
107 
108 
109 


110 
111 
112 


if (argc != 1) 

err quit("usage: printd"); 
daemonize("printd"); 
sigemptyset(&sa.sa_mask); 
sa.sa_flags = 0; 
sa.sa_handler = SIG_IGN; 
if (sigaction(SIGPIPE, &sa, NULL) < 0) 

log. sys("sigaction failed"); 

sigemptyset(&mask); 
sigaddset(&mask, SIGHUP); 
sigaddset(&mask, SIGTERM); 
if ((err = pthread_sigmask(SIG_BLOCK, &mask, NULL)) != 


log_sys("pthread_sigmask failed"); 
n = sysconf( SC HOST NAME MAX); 
if (n « 0) /* best guess */ 


113 n- HOST NAME MAX; 
114 if ((host = malloc(n)) == NULL) 
115 log. sys("malloc error"); 
116 if (gethostname(host, n) < 0) 


117 log. sys("gethostname error"); 

118 if ((err = getaddrlist(host, "print", &ailist)) != 0) { 

119 log_quit("getaddrinfo error: 96s", gai_strerror(err)); 
120 exit(1); 

121 } 


[98~ 100] 守护 进程 没有 任何 选项 (唯一 的 参数 是 命令 名 自身 ) ， 
所 以 如 果 argc 不 为 1， 调 用 er _quit 打 印 锋 误 信息 然后 退出 。 调 用 图 13- 
1 所 示 程 序 中 的 daemonize 函 数 成 为 一 个 守护 进程 。 在 此 之 后 ， 不 能 在 标 
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[101-110] 忽略 SIGPIPE“。 接 下 来 将 要 写 套 接 字 文件 描述 符 ， 并 且 
不 想 让 写 错 误 触 发 SIGPIPE， 因 为 其 默认 动作 是 杀 死 进程 。 下 一 步 ， 设 
置 线程 信号 掩 码 ， 包 括 SIGHUP 和 SIGTERM。 创 建 的 所 有 进程 均 继承 
这 个 信号 掩 码 。 使 用 SIGHUP 信和 号 告诉 守护 进程 再 次 读 取 配置 文件 ， 
SIGTERM 信和 号 告诉 守护 进程 执行 清理 工作 并 优雅 地 退出 。 

[111~117] 调用 sysconf 来 获取 主机 名 的 最 大 长 度 。 如 果 sysconf 失 
败 或 者 没有 定义 该 限制 ， 采用 HOST. NAME MAX 作为 最 佳 选择 。 有 
时 ， 平 台 已 经 定义 了 此 常量 ， 但 如 果 没 有 定义 ， 则 在 print.h 中 充 择 属于 
目 己 的 值 。 分 配 内 存 来 保存 主机 名 并 调用 gethostname 来 获取 。 

[118-121] 接 下 来 ， 笑 试 找到 用 于 守护 进程 提供 打印 假 脱 机 服务 的 
网 络 地 址 。 

122 FD ZERO(&rendezvous); 

123 maxfd = -1; 

124 for (aip = ailist; aip != NULL; aip = aip->ai_next) { 


125 
126 
127 
128 
129 
130 
131 
132 
133 
134 
135 
136 
137 
138 
139 
140 
141 
142 


if ((sockfd = initserver(SOCK. STREAM, aip->ai_addr, 
aip->ai_addrlen, QLEN)) >= 0) 1 
FD_SET(sockfd, &rendezvous); 
if (sockfd > maxfd) 
maxfd = sockfd; 


} 
if (maxfd == -1) 
log_quit("service not enabled"); 
pwdp = getpwnam(LPNAME); 
if (pwdp == NULL) 
log. sys(" can't find user 96s", LPNAME); 
if (pwdp-»pw. uid == 0) 
log. quit("user 96s is privileged", LPNAME); 
if (setgid(pwdp->pw_gid) < 0 || setuid(pwdp-»pw. uid) < 0) 
log. sys("can't change IDs to user 96s", LPNAME); 
init request(); 


init printer(); 


[1227-131] 清 雪 rendezvous 变 量 ， 该 变量 将 与 select 一 起 用 来 等 竺 客 


户 问 连 接 请 求 。 将 最 大 文件 摘 述 符 初 始 化 为 -1， 以 确 傈 所 分 配 的 第 一 


个 文件 摘 述 


符 会 大 于 maxfd ° 


对 于 每 个 需要 提供 服务 的 网 络 地 址 ， 调 用 initserver ( 见 图 16-22) 
来 分 配 和 初始 化 一 个 套 接 字 。 如 果 initserver 成 功 ， 将 其 文件 描述 符 加 入 
fd_set;， 如 果 该 描述 符 大 于 现 有 最 大 值 maxfd， 将 maxfd 设 为 该 描述 符 


值 。 


[132—133] 走 完整 个 addrinfo 结 构 列 表 后 ， 如 果 maxfd 仍 为 -1， 不 
能 启动 打印 假 脱 机 服务 ， 记 录 日 志 然 后 退出 。 


[134--140] 守护 进程 需要 超级 用 户 特权 来 绑 定 一 个 套 接 字 到 保留 
端口 。 完 成 缚 定 后 ， 通 过 将 用 户 ID 改变 为 jp 的 用 户 ID (回忆 21.4 市 的 安 
全 方面 的 讨论 ) 降低 该 程序 特权 。 这 里 想 遵循 最 小 特权 原则 ， 以 避免 
在 守护 进程 中 将 系统 暴露 给 任何 可 能 的 攻击 。 调 用 getpwnam 来 找到 与 
用 户 jp 相 关 的 口令 条 目 。 如 果 没 有 此 用 户 ， 或 者 p 具 有 超级 用 户 特权 ， 
记录 日 志 然 后 退出 。 否 则 ， 调 用 setuid 将 实际 用 户 ID 和 有 效用 户 ID 改 为 
lp 用 户 ID。 为 了 避免 暴露 系统 ， 如 末 不 能 减少 特权 ， 那 么 就 选择 不 提供 
任何 服务 。 

[141~142] 调用 init request 来 初始 化 作业 请 求 并 确 傈 只 有 一 个 守护 
进程 副本 正在 运行 。 调 用 init_printer 初 始 化 打印 机 信息 〈 稍 后 就 可 以 看 
到 这 两 个 函数 ) 。 

143 err = pthread_create(&tid, NULL, printer thread, NULL); 

144 if (err == 0) 


145 err = pthread_create(&tid, NULL, signal thread, NULL); 
146 if (err != 0) 
147 log_exit(err, "can’t create thread"); 


148 build qonstart(); 
149 log msg(" daemon initialized"); 


150 for (;;) 1 

151 rset = rendezvous; 

152 if (select(maxfd+1, &rset, NULL, NULL, NULL) < 0) 
153 log. sys("select failed"); 

154 for (i = 0; i <= maxfd; i++) ( 

155 if (FD ISSET(i, &rset)) 1 

156 y^ 

157 * Accept the connection and handle the 


request. 


158 g 

159 if ((sockfd = accept(i, NULL, NULL)) < 0) 

160 log. ret(" accept failed"); 

161 pthread create(&tid, NULL, client thread, 

162 (void *)((long)sockfd)); 

163 } 

164 } 

165 } 

166 exit(1); 

167 } 

[143~ 149] 创建 一 个 处 理 信号 的 线程 和 一 个 与 打印 机 通信 的 线 
程 。 (通过 限制 打印 机 只 与 一 个 线程 通信 ， 可 以 简化 与 打印 机 相关 的 
数据 结构 的 锁定 。) 然后 调用 build_gqonstart 在 /var/spool/printer 目 录 中 搜 
索 任何 挂 起 的 作业 。 对 于 找到 的 每 个 作业 ， 将 建立 一 个 结构 ， 让 打印 
机 线程 将 该 作业 的 文件 送 到 打印 机 。 至 此 ， 完 成 守护 进程 的 设置 ， 
此 记录 一 条 日 志 消 轧 ， 表 明和 守护 进程 初始 化 成 功 完 成 。 

[150~167] 将 rendezvous fd_set 结 构 复 制 到 rset， 然 后 调用 select 等 待 
其 中 的 一 个 文件 摘 述 符 变 为 可 读 。 必 须 复制 rendezvous， 因 为 select 会 修 
改 传 入 的 fd_set 结 构 来 包含 满足 事件 的 文件 描述 待 。 既 然 服务 器 已 经 将 
套 接 字 初 始 化 完毕 ， 一 个 可 读 的 文件 描述 符 束 意味 着 一 个 连接 请 求 需 
要 处 理 。 当 select 返 回 时 ， 检 查 rset 来 获取 一 个 可 读 的 文件 描述 符 。 如 采 
找到 一 个 ， 调 用 accept 接 受 该 请 求 。 如 果 失 败 ， 记 录 日 志 然 后 继续 检查 
更 多 的 可 读 文 件 描述 符 。 和 否则 ， 创 建 一 个 线程 来 处 理 客 户 端 请 求 。 主 
线程 main 一 直 循 环 ， 将 请 求 发 送 到 其 他 线程 处 理 ， 永 远 不 应 到 达 exit 语 
AJ o 

168 /* 

169 * Initialize the job ID file. Use a record lock to prevent 


170 * more than one printer daemon from running at a time. 
171 * 

172 * LOCKING: none, except for record-lock on job ID file. 
173 */ 


174 void 

175 init_request(void)176 { 

177 int n; 

178 char name[FILENMSZ |; 


179 sprintf(name, "96s/96s", SPOOLDIR, JOBFILE); 
180 jobfd = open(name, O CREAT|O RDWR, S IRUSR|S IWUSR); 
181 if (write lock(jobfd, 0, SEEK SET, 0) « 0) 


182 log. quit("daemon already running"); 
183 /* 

184 * Reuse the name buffer for the job counter. 
185 */ 

186 if ((n = read(jobfd, name, FILENMSZ)) « 0) 
187 log. sys("can't read job file"); 

188 if (n == 0) 

189 nextjob = 1; 

190 else 

191 nextjob = atol(name); 

192 } 


[168 ~ 182] EH XX init request 做 两 件 事 : TE fE My x 
ft/var/spool/printer/jobno. EJ — ide B, ZAJE AX E FEE RS 
要 赋值 的 作业 编号 。 在 整个 文件 上 放置 一 把 写 锁 ， 表 明 守 护 进 程 正 在 
运行 。 如 果 当 前 已 有 一 个 守护 进程 正在 运行 ， 想 启动 男 外 一 个 打印 假 
脱 机 守护 进程 副本 ， 该 程序 将 无 法 获得 写 锁 ， 然 后 就 退出 。 因 此 ， 同 


时 只 能 有 一 个 守护 进程 在 运行 。 (图 13-6 中 使 用 过 这 种 技术 ， 在 14.3 廊 
中 讨论 过 write_lock 宏 。) 

[183-192] 作业 文件 包含 一 个 ASCII 码 的 整数 字符 串 来 表示 下 一 个 
作业 编号 。 如 果 文 件 刚 创建 并 且 为 空 ， 那 么 将 nextjob 设 置 为 1。 F, 
使 用 atol 将 字符 第 转换 为 整数 并 将 其 作为 下 一 个 作业 编号 。 证 jobfd 对 
于 作业 文件 保持 打开 状态 ， 因 此 当 作 业 创 建 时 能 够 更 新 作业 编号 。 不 
能 关闭 该 文件 ， 因 为 这 将 释放 已 经 放置 在 上 面 的 写 锁 。 在 一 个 长 整 型 
数 长 度 为 64 位 的 系统 上 ， 至 少 需 要 一 个 21 字 市 的 缓冲 区 来 存放 代表 最 
大 长 整 型 数 的 字符 串 。 这 里 重用 文件 名 缓冲 区 ， 因 为 在 print.h 中 
FILENMSZE X 7164 ° 

193 /* 

194 * Initialize printer information from configuration file. 

195 * 

196 * LOCKING: none. 

197 */ 

198 void 

199 init_printer(void) 

200 { 

201 printer = get_printaddr(); 

202 if (printer == NULL) 


203 exit(1); /* message already logged */ 
204 printer_name = printer->ai_canonname; 
205 if (printer_name == NULL) 

206 printer_name = "printer"; 

207 log_msg("printer is 96s", printer name); 
208 } 


209 /* 


210 * Update the job ID file with the next job number. 

211 * Doesn't handle wrap-around of job number. 

212 * 

213 * LOCKING: none. 

214 */ 

215 void 

216 update jobno(void)217 1 

218 char buf[32]; 

219 if (Iseek(jobfd, 0, SEEK, SET) == -1) 

220 log. sys("can't seek in job file"); 

221 sprintf(buf, "96d", nextjob); 

222 if (write(jobfd, buf, strlen(buf)) « 0) 

223 log. sys("can't update job file"); 

224 } 

[193~208] init_printer 用 于 设置 打印 机 名 和 地 址 。 调 用 get_printaddr 

(来 自 util.c) 获得 打印 机 地 址 。 如 果 失 败 ， 记 录 日 ic 。 当 找 不 

到 打印 机 地 址 时 ， get printaddr 会 记录 目 己 的 错误 信息 日 志 。 如 果 打 
印 机 地 址 未 找到 ， 将 addrinfo 中 的 ai_canonname 没 为 打印 机 多 o 如果 该 
字段 为 空 ， 将 打印 机 名 设 为 默认 值 。 注 意 ， 将 正在 使 用 的 打印 机 名 也 
记录 在 日 志 中 ， 以 帮助 管理 员 能 够 诊断 假 脱 机 系统 的 问题 

[209—224] update_jobno 函 数 用 于 在 作业 文件 /varvspoolMprintervjobno 
中 写 入 下 一 个 作业 编号 。 站 先 ， 找 到 文件 开头 。 然 后 ， 将 整数 作业 编 
号 转换 为 一 个 字符 捉 并 写 入 文件 如 来 写 入 类 败 ; 记 采 日 志 并 退出 *。 
作业 编号 自动 递增 。 如 何 处 理 回 绕 的 作业 编号 留 作 一 个 练习 〈 见 习题 
21.9) 。 

225 /* 

226 * Get the next job number. 


227 * 

228 * LOCKING: acquires and releases joblock. 

229 */ 

230 int32 t 

231 get newjobno(void) 

232 ( 

233 int32 t jobid; 

234 pthread mutex lock(&joblock); 

235 jobid = nextjob++; 

236 if (nextjob <= 0) 

237 nextjob = 1; 

238 pthread_mutex_unlock(&joblock); 

239 return(jobid); 

240 } 

241 /* 

242 * Add a new job to the list of pending jobs. Then signal 
243 * the printer thread that a job is pending. 

244 * 

245 * LOCKING: acquires and releases joblock. 

246 */ 

247 void 

248 add_job(struct printreg *reqp, int32_t jobid) 

249 { 

250 struct job *jp; 

251 if (jp = malloc(sizeof(struct job))) == NULL) 
252 log_sys("malloc failed"); 

253 memcpy(&jp->req, reqp, sizeof(struct printreq)); 


[225 —- 240] get_newjobno 范 数 用 于 获得 下 一 个 作业 编号 。 首 先 将 
joblock 互 不 量 锁 住 。 递 增 nextjob 变 量 ， 并 处理 回 绕 的 情况 。 然 后 解锁 
互 斥 量 并 返回 递增 前 的 nextiiob 值 。 多 个 线程 可 以 同时 调用 
get newjobno; 需要 串 行 化 访问 下 一 个 作业 编号 ， 因 此 每 个 线程 得 到 一 
个 唯一 的 作业 编号 。 ( 见 图 11-9， 考 察 在 这 种 情况 下 ， 如 果 不 串 行 化 
线程 会 发 生 什么 情况 。) 

[241-253] add job 函数 用 于 在 挂 起 的 打印 作业 列表 中 增加 一 个 新 
的 作业 请 求 。 首 先 为 job 结构 分 配 空间 。 如 果 失 败 ， 记 录 日 志 并 退出 。 
此 时 ， 打 印 请 求 已 经 安全 地 存储 在 磁盘 上 ; 当 打 印 假 脱 机 守护 进程 重 
局 时 ， 会 重新 读 取 这 些 请 求 。 当 为 新 作业 分 配 完 空间 ， 将 客户 端的 请 
求 结构 复制 到 作业 结构 。 在 printh 中 一 个 job 结构 包含 一 对 列表 指针 ， 
一 个 作业 ID 和 一 个 从 客户 端 print 命 令 发 送 过 来 的 printreq 结 构 副 本 。 

254 jp->jobid = jobid; 

255 jp->next = NULL; 

256 pthread mutex lock(&joblock); 

257 jp->prev = jobtail; 

258 if (jobtail == NULL) 


259 jobhead = jp; 
260 else 
261 jobtail->next = jp; 


262 jobtail = jp; 

263 pthread_mutex_unlock(&joblock); 

264 pthread_cond_signal(&jobwait); 

265 } 

266 /* 

267 * Replace a job back on the head of the list. 
268 * 


269 * LOCKING: acquires and releases joblock. 
270 */ 

271 void 

272 replace job(struct job *jp) 

2731 

274 pthread mutex lock(&joblock); 

275 jp->prev = NULL; 

276 jp->next = jobhead; 

277 if (jobhead == NULL) 


278 jobtail = jp; 
279 else 
280 jobhead->prev = jp; 


281 jobhead = jp; 

282 pthread_mutex_unlock(&joblock); 

283 } 

[254~ 265] 保存 作业 ID 并 锁 住 joblock 互 斥 量 以 获得 对 打印 作业 链 
表 的 独占 访问 。 将 在 该 链表 尾 增加 新 的 作业 结构 。 将 新 的 作业 结构 的 
前 项 指针 (previous pointer) 指向 链表 中 最 后 一 个 作业 。 如 果 链 表 为 
空 ， 将 jobhead 指 回 狐 的 结构 。 和 否则 ， 将 链表 中 最 后 一 项 的 后 项 指针 

(next pointer) 指向 新 的 结构 。 然 后 设置 jobtail 指 向 新 的 结构 。 对 互 不 

量 解锁 ， 然 后 给 打印 机 线程 发 信号 ， 告 诉 该 线程 另 一 个 作业 可 用 了 。 

[266~283] 函数 replace_job 用 于 将 作业 插入 到 挂 起 作业 队列 头 部 e 
需要 获得 joblock 互 不 量 ， 将 job 结 构 中 的 前 项 指针 设 为 NULL， 将 后 项 
指针 指向 表 头 。 如 果 表 为 空 ， 将 jobtail 指 向 搬入 的 job 结构 。 和 否则 ， 将 表 
中 人 第 一 个 作业 结构 的 前 项 指针 指 回 插入 的 job 结构 。 然 后 将 jobhead 指 回 
插入 的 job 结构 ， 成 为 新 的 表 头 。 最 后 ， 释 放 joblock 互 太 量 。 

284 /* 


285 * Remove a job from the list of pending jobs. 
286 * 
287 * LOCKING: caller must hold joblock. 


288 */ 

289 void 

290 remove job(struct job *target) 

291 ( 

292 if (target->next != NULL) 

293 target->next->prev = target->prev; 
294 else 

295 jobtail = target->prev; 

296 if (target->prev !- NULL) 

297 target->prev->next = target->next; 
298 else 

299 jobhead = target->next; 

300 } 

301 /* 


302 * Check the spool directory for pending jobs on start-up. 
303 * 

304 * LOCKING: none. 

305 */ 

306 void 

307 build. qonstart(void) 

308 { 

309 int fd, err, nr; 

310 int32 t jobid; 

311 DIR *dirp; 


312 struct dirent *entp; 


313 struct printreq req; 
314 char dname[FILENMSZ], 
fname[FILENMSZ]; 


315 sprintf(dname, "%s/%s", SPOOLDIR, REQDIR); 

316 if ((dirp = opendir(dname)) == NULL) 

317 return; 

[284~ 300] remove job 将 给 定 的 作业 从 挂 起 的 作业 列表 中 删除 。 
调用 者 必须 已 经 和 持 有 joblock 互 斥 量 。 如 采 后 项 指针 不 为 衬 ， 将 下 一 个 
条 目的 前 项 指针 指 回 被 删除 目标 的 前 项 指针 所 指 加 的 条 目 。 人 否则 ， 该 
条 目 为 列表 中 最 后 一 个 ， 因 此 将 jobtail 指 向 被 删除 目标 的 前 项 指针 所 指 
回 的 条 目 。 如 采 被 删除 目标 的 前 项 指针 不 为 裤 ， 将 前 一 个 条 目的 后 项 
指针 指 辐 被 删除 目标 的 后 项 指针 所 指 回 的 条 目 。 人 和 否则， 这 个 是 表 中 第 
一 个 条 目 ， 因 此 将 jobhead 指 加 被 删除 目标 后 面 的 那个 条 目 。 

[301 ~ 317] 当 守 护 进 程 局 动 时 ， 调 用 build_qonstart 从 存储 
在 /varspool/printerreqs 中 的 磁盘 文件 建立 一 个 内 存 中 的 打印 作业 列 
表 。 如 末 不 能 打开 该 日 录 ， 表 示 没 有 打印 作业 要 处理 ， 因 此 束 返 回 。 

318 while ((entp = readdir(dirp)) != NULL) 1 


319 /* 

320 * Skip "." and ".." 

321 "i 

322 if (strcmp(entp-^d name, ".") == 0 || 
323 strcmp(entp-^d name, "..") == 0) 
324 continue; 

325 hs 

326 * Read the request structure. 


327 z 


328 


sprintf(fname, "%s/%s/%s", SPOOLDIR, REQDIR, 


entp-^d name); 


329 
330 
331 
332 
333 
334 
335 
336 
337 
338 
339 
340 
341 
DATADIR, 
342 
343 
344 
345 
346 
347 
348 
349 
350 
351} 


if ((fd = open(fname, O_RDONLY)) < 0) 
continue; 
nr = read(fd, &req, sizeof(struct printreq)); 
if (nr != sizeof(struct printreq)) { 
if (nr < 0) 
err = errno; 
else 
err = EIO; 
close(fd); 
log msg("build qonstart: can't read %s: %s", 
fname, strerror(err)); 
unlink(fname); 
sprintf(fname, "%s/%s/%s", SPOOLDIR, 


entp-^d name); 
unlink(fname); 
continue; 
} 
jobid = atol(entp->d_name); 
log. msg(" adding job %d to queue", jobid); 
add job(&req, jobid); 
} 
closedir(dirp); 


[318—324] 在 目录 中 一 次 读 取 一 个 条 目 ， 忽 略 . 和 ..。 


[325-345] 对 于 每 个 条 目 ， 创 建 一 个 文件 完全 路 径 名 并 只 读 打 
开 。 如 果 open 调 用 失败 ， 跳 过 该 文件 。 否 则 ， 将 读 取保 存在 文件 中 的 
printreq 结 构 。 如 果 不 能 读 取 整个 结构 ， 关 闭 该 文件 ， 记 和 隶 日 志 并 unlink 
该 文件 。 然 后 建立 相应 数据 文件 的 完全 路 径 名 ， 再 unlink 该 文件 。 

[346—351] 如 有 果 能 够 读 取 一 个 完整 的 printreq 结 构 ， 将 文件 名 转换 
为 作业 ID (文件 名 就 是 其 作业 ID) ， 记 录 日 志 ， 然 后 将 请 求 加 入 到 挂 
起 的 打印 作业 列表 。 当 读 完 整个 目录 ，readdir 返 回 NULL， 关 闭 目 杂 然 


后 返回 。 
352 Je 
353 * Accept a print job from a client. 
354 * 
355 * LOCKING: none. 
356 */ 
357 void* 
358 client thread(void *arg) 
359 | 
360 int n, fd, sockfd, nr, nw, first; 
361 int32 t jobid; 
362 pthread t tid; 
363 struct printreq req; 
364 struct printresp res; 
365 char name[FILENMSZ]; 
366 char buf[IOBUFSZ]; 
367 tid - pthread self(); 
368 pthread cleanup push(client cleanup, (void *)((long)tid)); 
369 sockfd = (long)arg; 


370 add worker(tid, sockfd); 


371 [* 


372 * Read the request header. 

373 2 

374 if ((n = treadn(sockfd, &req, sizeof(struct printreq), 10)) != 
375 sizeof(struct printreq)) { 

376 res.jobid = 0; 

377 if (n « 0) 

378 res.retcode = htonl(errno); 

379 else 

380 res.retcode = htonl(EIO); 

381 strncpy(res.msg, strerror(res.retcode), MSGLEN MAX); 
382 writen(sockfd, &res, sizeof(struct printresp)); 

383 pthread exit((void *)1); 

384 } 


[352~370] 当 连 接 请 求 被 接受 时 ，main YK Hiclent thread ° H 
作用 是 从 客户 端 print 命 令 中 接收 要 打印 的 文件 。 为 每 个 客户 端 打印 请 
求 分 别 创建 一 个 独立 的 线程 。 

首先 是 安装 线程 清理 处 理 程 序 ( 见 11.5 市 中 线程 清理 处 理 程序 的 讨 
i£) 。 清 理 处 理 程序 是 client_cleanup， 将 在 后 面 用 到 。 它 仅 带 一 个 参 
数 : 线程 ID。 然 后 调用 add_worker 来 创建 一 个 worker_thread 结 构 并 将 其 
加 入 到 活跃 的 客户 端 线程 列表 中 。 

[371-384] 此 时 ， 完 成 了 线程 的 初始 化 任务 ， 因 此 从 客户 端 读 取 
请 求 凑 。 如 采 客 户 端 发 送 的 数据 少 于 期 望 或 过 到 错误 ， 则 啊 应 一 个 消 
息 ， 该 消息 指出 错误 的 原因 ， 然 后 调用 pthread_exit 结 束 线 程 。 

385 req.size = ntohl(req.size); 


386 req.flags = ntohl(req.flags); 
387 f* 


388 
389 
390 
391 
392 
393 
394 
395 
396 
397 
398 
399 
400 
401 
402 
403 
404 
405 
406 
407 
408 
409 
410 
411 
412 
413 


* Create the data file. 
*/ 
jobid = get_newjobno(); 
sprintf(name, "%s/%s/%ld", SPOOLDIR, DATADIR, jobid); 
fd = creat(name, FILEPERM); 
if (fd < 0) { 
res.jobid = 0; 
res.retcode = htonl(errno); 
log_msg("client_thread: can't create %s: %s", name, 
strerror(res.retcode)); 
strncpy(res.msg, strerror(res.retcode), MSGLEN MAX); 
writen(sockfd, &res, sizeof(struct printresp)); 
pthread exit((void *)1); 
} 
/* 
* Read the file and store it in the spool directory. 
* Try to figure out if the file is a PostScript file 
* or a plain text file. 
m 
first = 1; 
while ((nr = tread(sockfd, buf, IOBUFSZ, 20)) > 0) { 
if (first) 1 
first = 0; 
if (strncmp(buf, "%!PS", 4) != 0) 
req.flags |= PR. TEXT; 


[385 ~ 401] H ERKA rn B BAS BER B CLE D HE. A 
get_newjobno 来 保存 这 个 打印 请 求 的 下 一 个 作业 编号 。 建 立 作 业 数 据 文 
件 ， 名 为 /var/spool/printer/data/jobid，jobid 是 请 求 的 作业 ID。 采 用 权限 
许可 来 防止 其 他 人 读 取 这 些 文 件 《printh 中 定义 FILEPERM 为 
S_IRUSRIS_IWUSR) 。 如 果 不 能 创建 该 文件 ， 记 录 错 误 日 志 ， 发 送 失 
败 啊 应 给 客户 端 ， 调 用 pthread_exit 结 束 线程 。 

[402-413] 读 取 来 和 目 客 户 端的 文件 内 容 ， 要 将 其 写 入 数据 文件 的 
私有 副本 中 。 但 是 在 写 任 何 东西 之 前 ， 需 要 在 第 一 次 循环 时 检查 一 下 
是 否 是 PostScript 文 件 。 如 果 该 文件 不 是 以 %!PS 模 式 开 头 ， 可 以 假定 为 
其 为 纯 文 本 文件 ， 这 种 情况 下 在 请 求 头 中 设置 PR_TEXT 标 志 。 (如 果 
在 print 命 令 中 有 -t 标 志 ， 那 么 客户 端 也 会 设置 此 标志 。) 尽管 PostScript 
程序 不 要 求 以 模式 %!PS 开 始 ， 但 文档 格式 指南 (Adobe Systems 
[1999]) 强烈 推荐 这 种 方式 。 


414 nw = write(fd, buf, nr); 

415 if (nw != nr) ( 

416 res.jobid = 0; 

417 if (nw « 0) 

418 res.retcode = htonl(errno); 

419 else 

420 res.retcode = htonl(EIO); 

421 log. msg("client thread: can’t write 96s: 96s", name, 

422 strerror(res.retcode)); 

423 close(fd); 

424 strncpy(res.msg,  strerror(res.retcode), 
MSGLEN MAX); 

425 writen(sockfd, &res, sizeof(struct printresp)); 


426 unlink(name); 


427 
428 
429 
430 
431 
432 
433 
434 
435 
436 
437 
438 
439 
440 
441 
442 
443 
444 
445 


jobid); 


Pm, 


446 
447 
448 


pthread exit((void *)1); 


} 
} 
close(fd); 
/* 


* Create the control file. Then write the 


* print request information to the control 


* file. 


*/ 


sprintf(name, "%s/%s/%d", SPOOLDIR, REQDIR, jobid); 
fd = creat(name, FILEPERM); 
if (fd « 0) { 


} 


res.jobid = 0; 
res.retcode = htonl(errno); 
log_msg("client_thread: can’t create %s: %s", name, 
strerror(res.retcode)); 
strncpy(res.msg, strerror(res.retcode), MSGLEN MAX); 
writen(sockfd, &res, sizeof(struct printresp)); 
sprintf(name, "%s/%s/%d", SPOOLDIR, DATADIR, 


unlink(name); 
pthread exit((void *)1); 


[414-430] FFR E 7E P? HY Oe E A Bi SC o WR write K 
WM, YR TERR Hom. RASCH CPPS, ACK h PETA GR OE 


删除 数据 文件 ， 调 用 pthread_exit 退 出 。 注 意 ， 不 需要 显 式 关闭 


套 接 字 文件 描述 符 。 当 调用 pthread_exit 时 ， 线 程 清 理 处 理 程序 会 处 理 


这 些 事情 。 


当 接 收 到 所 有 要 打印 的 数据 ， 关 闭 数 据 文件 的 文件 描述 符 。 

[4317-448] 接 下 来 ， 创 建文 件 /var/spool/printer/reqs/jobid 以 记 住 打 
印 请 求 。 如 有 果 人 失败， 记录 错误 日 志 ， 发 送出 错 啊 应 给 客户 闹 ， 删 除数 
据 文 件 ， 终 止 线程 。 


449 
450 
451 
452 
453 
454 
455 
456 
457 
458 
459 
460 
461 
462 
jobid); 
463 
464 
465 
466 
467 
468 


nw = write(fd, &req, sizeof(struct printreq)); 


if (nw != sizeof(struct printreq)) { 


} 


res.jobid = 0; 
if (nw < 0) 
res.retcode = htonl(errno); 
else 
res.retcode = htonl(EIO); 
log_msg("client_thread: can’t write %s: %s", name, 
strerror(res.retcode)); 
close(fd); 
strncpy(res.msg, strerror(res.retcode), MSGLEN MAX); 
writen(sockfd, &res, sizeof(struct printresp)); 
unlink(name); 
sprintf(name, "%s/%s/%d", SPOOLDIR, DATADIR, 


unlink(name); 
pthread exit((void *)1); 


close(fd); 


/* 


* Send response to client. 


469 "i 

470 res.retcode = 0; 

471 res.jobid = htonl(jobid); 

472 sprintf(res.msg, "request ID 96d", jobid); 

473 writen(sockfd, &res, sizeof(struct printresp)); 


474 /* 
475 * Notify the printer thread, clean up, and exit. 
476 m 


477 log. msg("adding job 96d to queue", jobid); 

478 add job(&req, jobid); 

479 pthread cleanup pop(1); 

480 return((void *)0); 

481 ) 

[449 — 465] 将 printreq 结 构 写 入 控制 文件 。 如 果 出 错 ， 则 记录 日 
志 ， 关 闭 欣 制 文件 描述 符 ， 发 送 失败 啊 应 给 客户 端 ， 删 除数 据 和 控制 
文件 ， 终 止 线程 。 

[466—473] 关闭 控制 文件 的 文件 描述 符 ， 并 发 送 消息 给 客户 病 ， 
该 消息 包括 作业 ID 和 成 功 状态 (retcode 设 为 0) 。 

[474—481] 调用 add_job 将 接收 的 文件 加 入 到 挂 起 作业 列表 中 ， 调 
用 pthread_cleanup_pop 完 成 清理 过 程 。 当 返回 时 线程 终止 。 注 意 ， 线 程 
退出 之 前 ， 必 须 关 闭 不 再 使 用 的 任何 文件 描述 符 。 与 线程 终止 不 同 ， 
当 一 个 线程 退出 并 且 进 程 中 仍 有 其 他 线程 时 ， 文 件 描述 符 不 会 目 动 关 
闭 。 如 果 不 关 闭 不 需要 的 文件 描述 符 ， 终 将 耗 尽 资源 。 

482  /* 

483 * Add a worker to the list of worker threads. 

484 zi 

485 * LOCKING: acquires and releases workerlock. 


486 "f 


487 void 

488 add worker(pthread t tid, int sockfd) 

489 ( 

490 struct worker thread — *wtp; 

491 if ((wtp = malloc(sizeof(struct worker thread))) == NULL) 
492 log. ret("add worker: can't malloc"); 
493 pthread exit((void *)1); 

494 } 

495 wtp->tid = tid; 

496 wtp->sockfd = sockfd; 

497 pthread_mutex_lock(&workerlock); 
498 wtp->prev = NULL; 

599 wtp->next = workers; 

500 if (workers != NULL) 

501 workers ->prev = wtp; 

503 workers = wtp; 

504 pthread_mutex_unlock(&workerlock); 
502 

505 } 

506  /* 

507 * Cancel (kill) all outstanding workers. 
508 " 


509 * LOCKING: acquires and releases workerlock. 
510 */ 
511 void 


512 kill workers(void) 


513 1 

514 struct worker thread — *wtp; 

515 pthread mutex lock(&workerlock); 

516 for (wtp = workers; wtp != NULL; wtp = wtp->next) 
517 pthread_cancel(wtp->tid); 

518 pthread_mutex_unlock(&workerlock); 

519 } 


[482~505] add. worker 将 一 个 worker. thread 结构 加 入 活动 线程 列 
表 中 。 分 配 该 结构 需要 的 内 存 ， 初 始 化 它 ， 锁 住 workerlock FRE, 
将 结构 加 入 到 列表 的 头 部 ， 然 后 解锁 互 不 量 。 

[5067-519] kill. workers 函数 遇 历 工作 者 线程 列表 ,然后 一 一 删除 。 
ie 7] 9] FEES S workerlock iJ Æ ° YER, pthread cancel DCDCREZ REI 
入 删除 计划 ， 实 际 的 删除 动作 在 每 个 线程 到 达 下 一 个 删除 点 时 发 生 。 

520 /* 

521 * Cancellation routine for the worker thread. 

522 a 

523 * LOCKING: acquires and releases workerlock. 

524 x 


525 void 

526 client cleanup(void *arg) 

527 { 

528 struct worker thread — *wtp; 

529 pthread t tid; 

530 tid = (pthread t)((long)arg); 

531 pthread mutex lock(&workerlock); 


532 for (wtp = workers; wtp != NULL; wtp = wtp->next) { 


533 if (wtp->tid == tid) ( 


534 if (wtp->next != NULL) 

935 wtp->next->prev = wtp->prev; 
536 if (wtp->prev != NULL) 

937 wtp->prev->next = wtp->next; 
538 else 

539 workers = wtp->next; 

540 break; 

541 } 

542 } 

543 pthread_mutex_unlock(&workerlock); 

544 if (wtp != NULL) { 

545 close(wtp->sockfd); 

546 free(wtp); 

547 } 

548 } 


[520~542] 函数 client_cleanup 是 与 客户 端 命令 通信 的 工作 者 线程 的 
线程 清理 程序 。 当 线程 调用 pthread_exit 时 ， 或 者 用 一 个 非 0 参数 调用 
pthread_cleanup_pop， 或 者 响应 一 个 删除 请 求 时 ，dlient_cleanup 函数 会 
被 调用 。 其 参数 是 终止 线程 隐 线 程 ID 。 

锯 住 workerlock 互 不 量 然后 搜索 工作 者 线程 列表 ， 直 到 找到 一 个 匹 
配 的 线程 ID。 当 找到 一 个 匹配 时 ， 从 列表 中 删除 工作 痢 线程 结构 并 且 
停止 搜索 。 

[543-548] 解锁 workerlock 互 斥 量 ， 关 闭 线程 用 于 和 客户 端 通信 
的 套 接 字 文 件 摘 述 符 ， 然 后 释放 worker _ thread 结构 的 内 存 。 

Ba YR SETA fu workerlock 4. FR £ , “4 kill_workers EX Z& 1E H 7j 91] Zz 
时 ， 如 果 一 个 线程 到 达 一 个 删除 点 时 ， 必 须 等 待 直 到 kill_ workers TEX 


互 不 量 时 才 可 以 继续 处 理 。 


549  /* 
550 * Deal with signals. 
551 X 


552 * LOCKING: acquires and releases configlock. 
553 */ 


554 void * 

555 signal thread(void *arg) 

556 | 

557 int err, signo; 

558 for (53) 1 

559 err = sigwait(&mask, &signo); 

560 if (err != 0) 

561 log_quit("sigwait failed: %s", strerror(err)); 
562 switch (signo) { 

963 case SIGHUP: 

564 "m 

565 * Schedule to re-read the configuration file. 
566 i 

567 pthread mutex lock(&configlock); 

568 reread - 1; 

569 pthread mutex unlock(&configlock); 

570 break; 

571 case SIGTERM: 

572 kill workers(); 

573 log msg('terminate with signal 96s", 


strsignal(signo)); 


574 exit(0); 


575 default: 

576 kill workers(); 

577 log. quit("unexpected signal 96d", signo); 
578 j 

579 } 

580 } 


[549~562] 函数 signal_thread 由 负责 处 理 信号 的 线程 运行 。 在 main 
函数 中 初始 化 信号 撼 码 ， 该 掩 码 包 括 SIGHUP 和 SIGTERM。 这 里 ， 调 
用 sigwait 来 等 待 这 些 信号 中 的 一 个 出 现 。 如 果 sigwait 失 败 ， 记 录 出 错 
日 志 并 退出 。 

[563~570] 如 果 接 收 到 SIGHUP ， 然 后 获得 configlock 互 斥 量 ， 将 
reread 变 量 设 为 1， 释 放 互 不 量 。 这 就 告诉 打印 机 守护 进程 在 其 处 理 循 
环 的 下 一 次 迭代 时 再 次 读 取 配置 文件 。[571~574] 如 果 接 收 到 
SIGTERM， 调 用 kill_workers 来 杀 死 所 有 的 工作 者 线程 ， 记 录 日 志 ， 然 
后 调用 exit 终 止 进程 。 

[575-580] 如 有 果 接 收 到 非 期 望 的 信号 ， 则 杀 死 工作 者 线程 并 调用 
log_quit 来 记录 日 志 然 后 退出 。 


581  /* 

582  * Add an option to the IPP header. 
583 * 

504  * LOCKING: none. 

585 € 

586  char* 


587 add option(char *cp, int tag, char *optname, char *optval) 


588 { 
589 int n; 


590 union { 

591 int16 t s; 
592 char c[2]; 
593 } u; 


594 *cpt++ = tag; 

595 n = strlen(optname); 

596 u.s = htons(n); 

597 *cp++ = u.c[0]; 

598  *cp++= u.c[1]; 

699 strcpy(cp, optname); 

600 cp +=n; 

601 n = strlen(optval); 

602 u.s = htons(n); 

603  *cp++ = u.c[0]; 

604 *cp++ = u.c[1]; 

605 strcpy(cp, optval); 

606 return(cp + n); 

607 } 

[581—593] 函数 add_option 用 于 在 送 到 打印 机 的 IPP 首 部 中 添加 一 个 
选项 ， 回 忆 图 21-4， 属 性 的 格式 是 1 字 节 的 描述 属性 类 型 的 标志 ， 然 后 
是 以 2 字 节 的 二 进 制 整数 形式 存储 的 属性 名 字 的 长 度 ， 接 着 是 名 字 ， 属 
性 值 的 长 度 ， 最 后 是 属性 值 本 里 。 

IPP 没 有 打算 去 控制 租 入 在 首部 的 二 进 制 整数 的 对 齐 方 式 。 一 些 处 
理 器 架构 ， 例 如 SPARC， 并 不 能 从 任 童 地址 效 入 一 个 整数 。 这 意味 着 
不 能 通过 如 下 方式 在 IPP 首部 存放 一 个 整数 : 该 方式 将 一 个 指针 转换 


成 intl6 t 指向 在 首部 存放 整数 的 地 址 。 相 反 ， 需 要 一 次 复制 1 字 节 整 
数 。 这 就 是 为 什么 我 们 定义 一 个 包含 16 位 整数 和 2 字 节 数组 的 union 。 

[594~ 607] 在 首部 存储 标志 并 将 属性 名 字 的 长 度 转 换 为 网 络 字 市 
序 。 一 次 复制 1 个 字 节 到 首部 。 接 着 复制 属性 名 字 。 重 复 这 个 过 程 ， 
继续 复制 属性 值 ， 并 返回 首部 中 下 一 个 应 该 开始 的 部 分 的 地 址 。 

608 /* 

609 * Single thread to communicate with the printer. 

610 * 

611 * LOCKING: acquires and releases joblock and configlock. 

612 */ 


613 void * 

614 printer thread(void *arg) 

615 { 

616 struct job *Íp; 

617 int hlen, ilen, sockfd, fd, nr, nw, extra; 
618 char *icp, *hcp, *p; 

619 struct ipp_hdr *hp; 

620 struct stat sbuf; 

621 struct iovec iov[2]; 

622 char name[FILENMSZ |; 
623 char hbuf[HBUFSZ ]; 
624 char ibuf[IBUFSZ]; 

625 char buf[IOBUFSZ]; 
626 char str[64]; 


627 struct timespec ts = { 60,0};  /* 1 minute */ 
628 for (;3) 1 
629 /* 


630 * Get a job to print. 

631 f 

632 pthread mutex lock(&joblock); 
633 while (jobhead == NULL) 1 


634 log msg("printer thread: waiting..."); 
635 pthread cond wait(&jobwait, &joblock); 
636 } 


637 remove_job(jp = jobhead); 

638 log_msg("printer_thread: picked up job 96d", jp->jobid); 

639 pthread mutex unlock(&joblock); 

640 update jobno(); 

[608—627] 函数 printer thread 由 与 网 络 打印 机 通信 的 线程 运行 。 使 
用 icp 和 ibuf 来 建立 IPP 首 部 。 使 用 hcp 和 hbuf 建 立 HTTP 首 部 。 需 要 在 独 
立 的 缓冲 区 中 建立 首部 。HTTP 首 部 包括 ASCII 表 示 的 长 度 字 段 ， 而 且 
在 拼装 出 IPP 首 部 之 前 ， 并 不 知道 应 该 预 留 多 大 的 空间 。 在 一 次 调用 中 
使 用 writev 来 写 这 两 个 头 。 

[628~640] 打印 机 线程 在 一 个 等 待 将 作业 传送 到 打印 机 的 无 限 循 
环 中 运行 。 使 用 joblock 互 不 量 来 你 护 作 业 列 表 。 如 果 作 业 没 有 挂 起 ， 
使 用 pthread_cond_wait 来 等 得 到 来 的 作业 。 当 一 个 作业 准备 好 时 ， 调 
用 remove. job 将 其 从 列表 中 删除 。 

此 时 仍 持 有 互 不 量 ， 因 此 释放 互 不 量 并 调用 update jobno 将 下 一 
个 作业 号 编写 入 到 /var/spool/printer/jobno ° 


641 pt 

642 * Check for a change in the config file. 
643 */ 

644 pthread_mutex_lock(&configlock); 


645 if (reread) { 


646 
647 
648 
649 
650 
651 
652 
653 
654 
655 
656 
657 
658 
>jobid); 
659 
660 
661 
662 
663 
664 
665 
666 
667 
668 
669 
670 
671 


freeaddrinfo(printer); 
printer = NULL; 
printer_name = NULL; 
reread = 0; 
pthread_mutex_unlock(&configlock); 
init_printer(); 
} else { 
pthread_mutex_unlock(&configlock); 
} 
f* 
* Send job to printer. 
*/ 
sprintf(name, "%s/%s/%ld", SPOOLDIR, DATADIR, jp- 


if ((fd = open(name, O RDONLY)) < 0) 1 
log msg("job 96ld canceled - can't open 96s: 96s", 
jp->jobid, name, strerror(errno)); 
free(jp); 
continue; 
} 
if (fstat(fd, &sbuf) < 0) { 
log msg("job %ld canceled - can't fstat 96s: 96s", 
jp->jobid, name, strerror(errno)); 
free(jp); 
close(fd); 


continue; 


[641~ 654] 现在 有 了 要 打印 的 作业 ， 检 查 一 下 配置 文件 有 无 改 
变 。 锁 住 configlock 互 不 量 并 检查 reread 变 量 。 如 果 该 值 非 0， 那 么 释放 
日 的 addrinfo 列 表 ， 清 空 指 针 ， 解 锁 互 斥 量 ， 然 后 调用 init_printer 来 重 
新 初始 化 指针 信息 。 有 既然 从 main 线 程 初始 化 后 只 有 这 个 上 下 文 可 以 查 


看 并 可 能 更 改 打 印 机 信息 ， 因 此 除了 使 用 configlock 互 不 量 来 保护 reread 
标志 的 状态 外 ， 不 需要 任何 其 他 的 同步 手段 。 
注意 ， 尺 管 在 此 函数 中 获得 和 释放 两 个 不 同 互 不 量 ,， 但 是 并 没有 
同时 持 有 两 个 互 斥 量 ， 因 此 不 需要 建立 一 个 锁 层 次 ( 见 11.6.2 节 ) ° 
[6557-671] 如 果 不 能 打开 数据 文件 ， 则 记录 出 错 日 志 ， 释 放 job 结 


构 ， 然 后 继续 。 


打开 文件 之 后 ， 调 用 fstat 来 找到 文件 的 大 小 。 如 果 失 


败 ， 记 隶 出 钳 日 志 并 清理 ， 然 后 继续 。 


672 


673 
674 
96s", 
675 
676 
677 
678 
679 
680 
681 
682 
683 
684 
685 


if ((sockfd = connect. retry(AF. INET, SOCK. STREAM, 


printer-^ai addr, printer->ai_addrlen)) < 0) 1 


log msg("job 96d deferred - can’t contact printer: 


jp->jobid, strerror(errno)); 

goto defer; 
} 
/* 
* Set up the IPP header. 
g 
icp = ibuf; 
hp = (struct ipp_hdr *)icp; 
hp->major_version = 1; 
hp->minor_version = 1; 
hp->operation = htons(OP_PRINT_JOB); 


686 hp->request_id = htonl(jp->jobid); 


687 icp += offsetof(struct ipp_hdr, attr_group); 

688 *icp++ = TAG_OPERATION_ATTR; 

689 icp = add option(icp, TAG_CHARSET, "attributes- 
charset", 

690 "utf-8"); 

691 icp = add option(icp, TAG NATULANG, 

692 "attributes-natural-language", "en-us"); 

693 sprintf(str, "http://26s/ipp", printer name); 

694 icp = add option(icp, TAG URI, "printer-uri", str); 

695 icp = add option(icp, TAG NAMEWOLANG, 

696 "requesting-user-name", jp->req.usernm); 

697 icp = add option(icp, TAG NAMEWOLANG, "job- 
name", 

698 jp->req.jobnm); 


[672~677] 打开 一 个 连接 到 打印 机 的 流 套 接 字 。 如 有 果 connect_retry 
调用 失败 ， 跳 到 defer 处 ， 在 这 里 铺 理 、 延 迟 一 段 时 间 ， 然 后 再 符 试 。 

[678~698] 接 下 来 ， 建 立 IPP 首 部 。 其 操作 是 打印 作业 (print-job) 
请 求 。 使 用 htons 将 2 字 市 的 操作 ID 从 主机 转换 为 网 络 字 节 序 ， 使 用 htonl 
将 4 字 贡 的 作业 ID 从 主机 转换 为 网 络 字 节 序 。 完 成 首部 的 初始 化 之 后 ， 
设置 标志 值 来 指示 其 后 跟随 操作 属性 。 

调用 add_option 将 属性 添加 到 报 文 中 。 图 12-5 列 出 了 打印 作业 请 来 
所 需 的 操作 属性 ， 前 3 个 是 必需 的 。 将 字符 集 设 为 UTF-8， 该 字符 集 是 
打印 机 必须 支持 的 ;指定 语言 为 en-us， 即 代表 美国 英语 (U.S. 
English) ; 另外 一 个 必需 的 属性 是 URI (Uniform Resource 
Identifier) ， 将 其 设 为 http:Wprinter_name/ipp。 


推荐 使 用 requesting-user-name 属 性 ， 但 不 是 必需 的 。job-name 属 性 
也 是 可 选 的 。print 命 令 将 要 打印 的 文件 名 作为 作业 名 发 送 ， 该 名 字 能 
够 帮助 用 户 区 别 多 个 要 处 理 的 作业 。 


699 
700 
701 
702 
703 
704 
705 
706 
format", p); 
707 
708 
709 
710 
711 
712 
713 
714 
715 
716 
717 
718 
719 
720 
IPP PORT); 


if (jp->req.flags & PR. TEXT) 1 
p = "text/plain"; 
extra = 1; 

} else 1 
p = "application/postscript"; 


extra = 0; 


icp = add_option(icp, TAG_MIMETYPE, "document- 


*icp++ = TAG END OF ATTR; 

ilen = icp - ibuf; 

L 

* Set up the HTTP header. 

gi 

hcp - hbuf; 

sprintf(hcp, "POST /ipp HTTP/1.1\r\n"); 
hcp += strlen(hcp); 

sprintf(hcp, "Content-Length: %ld\r\n", 
(long)sbuf.st_size + ilen + extra); 

hcp += strlen(hcp); 

strcpy(hcp, "Content-Type: application/ipp\r\n"); 
hcp += strlen(hcp); 


sprintf(hcp, "Host: %s:%d\r\n", printer name, 


721 hcp += strlen(hcp); 


722 *hcptt = "v; 
723 *hcpt-t = "wr; 
724 hlen = hcp - hbuf; 


[699~ 708] 提供 的 最 后 一 个 属性 是 document-format ° WRAZ 
属性 ， 则 假定 文件 格式 是 打印 机 默认 格式 。 对 于 PostScript 打 印 机 ， 格 
式 可 能 是 PostScript， 但 是 一 些 打 印 机 可 以 目 动 检测 格式 并 在 PostScript 
与 纯 文本 或 PCL (HP 的 打印 机 命令 语言 ) 格式 间 做 选择 。 如 果 
PR_TEXT 标 志 被 设置 ， 则 将 文档 格式 设置 为 textplain。 人 否则 ， 设 置 为 
application/postscript。 人 然后 在 属性 结束 处 用 结束 属性 标志 定 界 并 计算 
IPP 首 部 的 大 小 。 

整数 extra 用 来 记录 任何 可 能 需要 传输 到 打印 机 的 附加 字符 。 稍 后 
会 看 到 ， 需 要 发 送 一 个 附加 字符 以 能 够 可 靠 地 打印 纯 文本 。 当 要 计算 
内 容 长 度 时 ， 需 要 考虑 这 个 附加 字符 。 

[709~ 724] 现在 知道 了 IPP 首 部 的 大 小 ， 可 以 建立 HTTP 首 部 。 将 
Context-Length 设 为 IPP 首 部 的 字 广 长 度 加 上 要 打印 文件 的 大 小 再 加 上 需 
要 发 送 的 附加 字符 的 长 度 。 

Content-Type 为 application/ipp。 用 回 车 换行 符 结 束 HTTP 首 部 。 最 
后 ， 计 算 HTTP 首 部 的 大 小 。 


725 p 

726 * Write the headers first. Then send the file. 
727 

728 iov[0].iov base = hbuf; 

729 iov[0].iov. len = hlen; 

730 iov[1].iov. base = ibuf; 

731 iov[1].iov len - ilen; 


732 if (writev(sockfd, iov, 2) != hlen + ilen) { 


733 
734 
735 
736 
737 
738 
739 
740 
741 
742 
743 
744 
745 
746 
747 
748 
749 
750 
nw, nr); 
751 
752 
753 


log. ret("can't write to printer"); 
goto defer; 
} 
if (jp->req.flags & PR_TEXT) { 
L 
* Hack: allow PostScript to be printed as plain text. 
*/ 
if (write(sockfd, "b", 1) != 1) ( 
log. ret("can't write to printer"); 


goto defer; 


} 
while ((nr = read(fd, buf, IOBUFSZ)) > 0) { 
if (aw = writen(sockfd, buf, nr)) != nr) { 
if (nw < 0) 
log. ret("can't write to printer"); 
else 


log_msg("short write (%d/%d) to printer", 


goto defer; 


} 


[7257-735] 将 iovec 数 组 的 第 一 个 元 素 指向 HTTP 首 部 ， 第 二 个 元 素 
指向 IPP 首 部 。 然 后 采用 writev 将 两 个 首部 送 往 打 印 机 。 如 果 写 失败 或 
者 写 入 少 于 请 求 的 字 市 数 ， 则 记录 日 志 并 跳 转 到 defer， 在 这 里 清理 并 
延迟 一 段 时 间 ， 然 后 再 次 尝试 。 


[736~744] 即使 指明 了 纯 文 本 ，Phaser 8560 还 是 会 目 动 检 测 文 档 格 
式 。 为 了 防止 它 识 别 出 要 以 纯 文 本 格式 打印 的 文件 的 开头 ， 将 退 格 作 
为 第 一 个 发 送 字 符 ， 这 个 字符 不 会 被 打印 出 来 ， 并 且 能 够 使 目 动 识别 
文件 格式 功能 失效 。 这 就 可 以 打印 PostScript 源 文件 而 不 用 打印 
PostScript 文 件 的 镜像 。 

[7457-753] 通过 IOBUFSZ 块 将 数据 文件 发 往 打 印 机 。 当 套 接 字 缓 
冲 区 满 的 时 候 ，write 的 发 送 少 于 请 求 ， 因 此 可 以 用 write 处 理 这 种 情 
况 。 当 写 首 部 时 ， 不必 担 心 这 种 情况 ， 因 为 它们 都 很 小 ， 但 要 打印 的 
文件 却 是 很 大 的 。 


754 if (nr < 0) { 

755 log. ret("can't read 96s", name); 

756 goto defer; 

757 } 

758 /* 

759 * Read the response from the printer. 

760 */ 

761 if (printer_status(sockfd, jp)) { 

762 unlink(name); 

763 sprintf(name, "%s/%s/%d", SPOOLDIR, REQDIR, 
jp->jobid); 

764 unlink(name); 

765 free(jp); 

766 jp = NULL; 

767 } 

768 defer: 

769 close(fd); 


770 if (sockfd >= 0) 


771 close(sockfd); 

772 if (jp != NULL) { 

773 replace_job(jp); 

774 nanosleep(&ts, NULL); 

775 } 

776 } 

777 } 

778 /* 

779 * Read data from the printer, possibly increasing the buffer. 

780 * Returns offset of end of data in buffer or -1 on failure. 

781 * 

782 * LOCKING: none. 

783 */ 

784 ssize t 

785 readmore(int sockfd, char **bpp, int off, int *bszp) 

[7547-757] 读 到 文件 末尾 时 ，read 返 回 0。 如 果 读 失败 ， 记 录 错 误 
fei i, H 5 JF BE 28 defer » [758 — 767] 将 文件 发 送 给 打印 机 后 ， 调 用 
printer_status 来 谈 取 打印 机 对 于 请 求 的 啊 应 。 

如 果 成 功 ，printer_status 返 回 一 个 非 0 值 ， 束 可 以 删除 数据 文件 和 
控制 文件 。 然 后 释放 job 结构 ， 将 其 指针 设 为 NULL ， 然 后 到 达 defer 标 
XX o 

[768—777] 在 defer 标 签 处 ， 关 闭 打 开 的 数据 文件 描述 符 。 如 果 套 
接 字 摘 述 符 是 有 效 的 ， 也 将 其 关闭。 如 出 错 ，jp 指向 要 打印 作业 的 作 
业 结 构 ， 这 样 就 可 以 将 作业 放 在 挂 起 作业 列表 的 头 部 然后 延迟 1 分 钟 。 
如 果 成 功 ，jp 为 NULL， 此 时 只 需 回 到 循环 开始 处 ， 获 得 下 一 个 要 打印 
的 作业 。 

[7787-785] readmore 芳 数 用 于 读 取 来 自打 印 机 的 部 分 响应 消息 。 


786 { 

787 Ssize t nr; 

788 char *bp = *bpp; 
789 int bsz =*bszp; 
790 if (off >= bsz) { 


791 bsz += IOBUFSZ; 

792 if ((bp = realloc(*bpp, bsz)) == NULL) 

793 log. sys("readmore: can't allocate bigger read 
buffer"); 

794 *bszp =bsz; 

795 *bpp =bp; 

796 } 

797 if ((nr = tread(sockfd, &bp[off], bsz-off, 1)) > 0) 

798 return(off+nr); 

799 else 

800 return(-1); 

801 } 

802 /* 


803 * Read and parse the response from the printer. Return 1 
804 * if the request was successful, and 0 otherwise. 

805 * 

806 * LOCKING: none. 

807 */ 

808 int 


809 printer status(int sfd, struct job *jp)810 { 


811 int i, success, code, len, found, bufsz, datsz; 
812 int32 t jobid; 

813 ssize t nr; 

814 char *bp, *cp, *statcode, *reason, *contentlen; 


815 struct ipp_hdr h; 

816 /* 

817 * Read the HTTP header followed by the IPP response header. 

818 * They can be returned in multiple read attempts. Use the 

819 * Content-Length specifier to determine how much to read. 

820 a 

[786~801] 如 果 到 达 缓 冲 区 尾部 ， 通 过 相应 的 参数 bpp 和 bszp 重 新 
分 配 一 个 大 一 点 的 缓冲 区 并 返回 该 靳 的 缓冲 区 的 起 始 地 址 以 及 缓冲 区 
大 小 。 上 述 任 何 一 种 情况 下 ， 从 缓冲 区 已 读数 据 的 末尾 开始 读 取 缓冲 
区 所 能 容纳 的 尽 可 能 多 的 数据 。 返 回 相应 的 已 读数 据 的 新 侦 移 量 。 如 
果 read 失 败 ， 或 者 超时 ， 返 回 -1。 

[802 ~ 820] printer status K ZKE GET EN DSE— “PT E E ME a Se IRI 
应 消 轧 。 不 知道 打印 机 会 如 何 啊 应 : YEA TE RP TROC BS — 7n 
应 ， 也 许 在 一 个 报 文中 回 送 完整 的 响应 ， 或 者 包括 一 个 中 间 确 认 ， 诸 
如 HTTP 100 Continue 报 文 。 需 要 处 理 所 有 的 可 能 性 。 

821 success =0 ; 

822  bufsz -IOBUFSZ; 

823 if ((bp = malloc(IOBUFSZ)) == NULL) 


824 log sys("printer status: can't allocate read buffer"); 
825 while ((nr = tread(sfd, bp, bufsz, 5)) > 0) { 
826 /* 


827 * Find the status. Response starts with "HTTP/x.y" 


828 * so we can skip the first 8 characters. 


829 */ 

830 cp = bp + 8; 

831 datsz =nr; 

832 while (isspace((int)*cp)) 

833 CP+ 十 ; 

834 statcode =cp; 

835 while (isdigit((int)*cp)) 

836 cpt++; 

837 if (cp == statcode) { /* Bad format; log it and move on */ 

838 log_msg(bp); 

839 } else { 

840 *cpt+ ="\0’; 

841 reason =cp; 

842 while (*cp != "Ww? && *cp != ’\n’) 

843 cpt++; 

844 *cp =’\0’; 

845 code =atoi(statcode); 

846 if (HTTP_INFO(code)) 

847 continue; 

848 if ((QHTTP_SUCCESS(code)) { /* probable error: log 
it */ 

849 bp[datsz] =’\0’; 

850 log_msg("error: 96s", reason); 

851 break; 


852 j 


[821-838] 分 配 一 个 缓冲 区 并 读 取 来 自打 印 机 的 数据 ， 期 望 5 秒 之 
内 有 可 用 的 响应 。 跳 过 HTTP/.1 和 报 文 开始 的 所 有 空格 ， 然 后 是 数字 
状态 码 。 如 果 不 是， 在 日 志 中 记录 报 文 的 内 容 。 

[839 一 844] 如 果 在 响应 中 找到 一 个 数字 状态 码 ， 将 其 开始 的 非 数 
字 字 符 转 换 成 null 字 节 (这 一 字符 是 某 种 形式 的 空白 ) 。 接 下 来 是 一 个 
表明 原因 的 字符 串 (文本 消息 ) 。 搜 索 回 车 或 换行 符 ， 并 采用 null 字 市 
结束 文本 字符 串 。 

[845~852] 调用 atoi 函 数 将 状态 码 字符 串 转 化 成 一 个 整数 。 如 采 仅 
是 提供 信息 的 报 文 ， 将 其 忽略 并 继续 循环 。 我 们 期 望 看 到 的 要 么 是 成 
功 消息 要 么 是 出 错 消息 。 如 果 得 到 出 错 消息 ， 记 录 出 错 日 志 并 退出 循 


D 

853 /* 

854 * HTTP request was okay, but still need to check 

855 * IPP status. Search for the Content-Length. 

856 2 

857 i = cp - bp; 

858 for G;) { 

859 while (*cp != °C’ && *cp != °C && i < datsz) 
t 

860 cpt++; 

861 i++; 

862 } 

863 if (i >= datsz) { /* get more header */ 

864 if ((nr = readmore(sfd, &bp, i, &bufsz)) < 
0) t 

865 goto out; 


866 ) else { 


867 cp =&bp[i]; 


868 datsz += nr; 

869 } 

870 } 

871 if (strncasecmp(cp, "Content-Length:", 15) == 
0) t 

872 cp += 15; 

873 while (isspace((int)*cp)) 

874 cptt; 

875 contentlen =cp; 

876 while (isdigit((int)*cp)) 

877 cptt; 

878 *cp++ cU 

879 i= cp - bp; 

880 len =atoi(contentlen); 

881 break; 

882 } else 1 

883 cptt; 

884 itt; 

885 } 

886 } 


[853~870] 如 果 HTTP 请 求 成 功 ， 需 要 检查 IPP 状 态 。 搜 索 整 个 报 文 
直到 找到 Content-Length 属 性 。HTTP 首部 的 关键 字 是 大 小 写 敏 感 的 ， 
因此 需要 同时 检查 小 写 和 大 写字 符 。 如 果 绥 冲 区 空间 耗 尽 ， 需 要 调用 
readmore， 通 过 它 再 调用 realloc 描 加 缓冲 区 大 小 。 

因为 缓冲 区 地 址 可 能 改变 ， 需 要 调整 cp 指向 正确 的 缓冲 区 位 置 。 


[871~ 886] {E H strncasecmp EX Zi E fT A) Ej BUR EG e. WREE 
Content-Length 属 性 字符 串 ， 束 搜索 它 的 值 。 将 数字 字符 串 转 换 为 整数 
并 退出 这 个 for 人 循环 。 如 采 比 较 失 败 ， 继 续 逐 个 字 节 搜索 缓冲 区 。 如 采 
直到 缓冲 区 末尾 仍 末 找到 Content-Length 属 性 ， 就 从 打印 机 读 取 更 多 数 
据 并 继续 搜索 。 


887 if (i >= datsz) { /* get more header */ 

888 if ((nr = readmore(sfd, &bp, i, &bufsz)) < 0) { 
889 goto out; 

890 } else 1 

891 cp -&bpli]; 

892 datsz += nr; 

893 j 

894 } 

895 found =0 ; 

896 while (!found) { /* look for end of HTTP header */ 
897 while (i < datsz - 2) { 

898 if (*cp == ^n' && *(cp + 1) == AT && 
899 *(cp + 2) == ’\n’) { 

900 found =1 ; 

901 cp += 3; 

902 i += 3; 

903 break; 

904 } 

905 cpt++; 

906 i++; 

907 } 


908 if (i >= datsz) { /* get more header */ 


909 if (mr = readmore(sfd, &bp, i, &bufsz)) < 
0) t 


910 goto out; 

911 ) else 1 

912 cp =&bplil; 

913 datsz += nr; 

914 j 

915 j 

916 } 

917 if (datsz - i < len) { /* get more header */ 
918 if ((nr = readmore(sfd, &bp, i, &bufsz)) < 0) { 
919 goto out; 

920 } else { 

921 cp -&bpli]; 

922 datsz += nr; 


[887~916] 现在 知道 报 文 的 长 度 了 (通过 Content-Length 属性 ) 
如 有 果 耗 尽 缓冲 区 ， 那 么 从 打印 机 再 次 读 取 。 接 下 来 搜索 HTTP 首部 的 
末尾 (空白 行 )。 如 果 找 到 了 ， 就 设置 found 标 志 并 跳 过 空白 行 。 无 论 
何 时 调用 readmore， 
以 防止 重 分 配 时 缓冲 区 地 址 改变 

[917--922] 如 果 找 到 HTTP 首 部 的 末尾 ， 计 算 HITP 首 部 所 用 的 字 
斑 数 。 如 采 读 取 的 值 减 去 HITP 首 部 的 大 小 后 不 等 于 IPP 报 文 的 数据 长 
E (该 值 从 内 容 长 度 Content-Length 中 计算 ) ， 需 要 读 取 更 多 的 数据 。 

923 } 

924 } 

925 memcpy(&h, cp, sizeof) (struct ipp_hdr); 

926 i = ntohs(h.status); 


927 
928 
929 
930 
931 
932 
933 
934 
935 
936 
937 
938 
939 
940 
941 
942 
943 
%s", 
944 
945 
946 


947 } 


jobid = ntohl(h.request_id); 
if (jobid != jp->jobid) { 


/* 
* Different jobs. Ignore it. 
2 
log msg("jobid 96d status code 96d", jobid, i); 
break; 
} 
if (STATCLASS_OK(i)) 
success = 1; 
break; 
} 
} 
out: 
free(bp); 
if (nr < 0) { 
log_msg("jobid %d: error reading printer response: 
jobid, strerror(errno)); 
} 
return(success); 


[923~927] JAIPP Er EB FIRACIAASALVEMLID 9. PERI ANAF TIY 
的 整数 形式 存储 ， 因 此 需要 调用 ntohs 和 ntohl 将 其 转换 为 主机 字 节 序 。 

[928-939] 如 果 作 业 ID 不 匹配 ， 表 明 并 非 是 对 我 们 请 求 的 响应 ， 
那么 记录 日 志 并 退出 外 层 while 循 环 。 如 果 IPP 状 态 指 示 为 成 功 ， 保 存 返 
回 值 并 退出 循环 。 


[940—947] 在 退出 之 前 ， 要 释放 用 来 存放 响应 报 文 的 缓冲 区 。 如 
果 打 印 请 求 成 功 则 返回 1， 否 则 失败 ， 返 回 0。 

这 里 总 结 本 章 中 这 个 扩展 的 例子 。 本 章 中 的 程序 在 Xerox Phaser 
8560 网 络 PostScript 打 印 机 上 测试 。 遗 憾 的 是 ， 当 文档 格式 设置 为 
text/plain 上 时， 这 个 打印 机 并 没有 禁止 它 的 目 动 识别 格式 功能 。 我 们 使 
用 了 一 个 小 技巧 ， 使 得 在 想 要 以 纯 文 本 格式 对 待 一 个 文档 时 ， 打 印 机 
不 目 动 识别 文档 格式 。 一 种 替代 的 方法 是 使 用 诸如 a2ps(1) 这 样 的 实用 
工具 将 源 打 印 成 一 个 PostScript 程序 。a2ps(1) 可 以 在 打印 前 封装 
PostScript 程 序 。 


21.6 小 结 


本 章 仔 细 考 查 了 两 个 完整 的 程序 : 一 个 打印 假 脱 机 守护 进程 将 作 
业 发 送 到 网 络 打印 机 和 一 个 命令 行程 序 将 打印 作业 提交 到 假 脱 机 守护 
进程 。 这 给 我 们 一 个 机 会 ， 考 查 在 一 个 实际 程序 中 使 用 前 面 革 市 所 讲 
述 的 许多 特性 ， 如 线程 、IO 多 路 技术 、 文 件 O、 肆 接 字 IO 以 及 信 


r1 


E e 


习题 


21.1 将 ipp.h 中 所 列 的 IPP 错 误 码 转换 成 错误 消 恩 。 然 后 修改 打印 假 
脱 机 守护 进程 ， 当 IPP 首 部 指示 有 打印 机 错误 时 ， 在 printer_status 函 数 
结尾 处 记录 日 志 。 

21.2 增强 print 命 令 和 printd 守 护 进 程 ， 使 得 用 户 可 以 请 求 双 面 打 
印 ， 并 文 持 横向 打印 和 纵 同 打印 。 


21.3 修改 打印 假 脱 机 守护 进程 ， 当 其 开始 时 ， 能 够 联系 打印 机 并 
找 出 所 支持 的 特性 ， 这 样 守护 进程 就 不 会 请 求 打 印 机 不 支持 的 选项 。 

21.4 写 一 个 命令 行程 序 来 报告 挂 起 的 打印 作业 状态 。 

21.5 写 一 个 命令 行程 序 来 取消 一 个 挂 起 的 打印 作业 。 使 用 作业 ID 
作为 命令 参数 来 指明 取消 哪个 作业 。 如 果 防 止 一 个 用 户 取 消 男 一 个 用 
户 的 打印 作业 ? 

21.6 在 打印 假 脱 机 守护 进程 中 文 持 多 个 打印 机 ， 并 包括 将 一 个 打 
印 作 业 从 本 打印 机 移 到 另 一 个 打印 机 的 方式 。 

21.7 解释 为 什么 在 打印 机 守护 进程 中 ， 当 信号 处 理 线 程 捕 捉 到 
SIGHUP 并 将 reread 设置 为 1 时 ， 不 需要 唤醒 打印 机 线程 ? 

21.8 ÆŒprinter_status HA "P, 38 1X £t 3 HTTPR'JContent-Length/& TEE 
搜索 IPP 报 文 的 长 度 。 这 一 技术 在 使 用 块 传输 编码 的 打印 机 上 不 起 作 
用 。 在 RFC 2616 中 查找 块 消 居 是 如 何 格 式 化 的 ， 然 后 修改 
Printer_status， 使 其 也 能 够 文 持 这 种 形式 的 啊 应 。 

21.9 f£update jobnoERZ rH, 4 P—" P TENE ds MR AIEEE SE) 
1 时 (8 Dl get_newjobno) ， 可 能 会 将 一 个 较 大 的 编号 改写 为 一 个 较 小 
的 编号 。 这 可 能 导致 守护 进程 重启 时 读 到 一 个 错误 的 编号 。 对 于 这 一 
问题 是 否 有 简单 的 解决 方法 ? 


附录 A 函数 原型 


本 附录 包含 了 正文 中 说 明 过 的 标准 ISO C、POSIX 和 UNIX 系 统 的 
函数 原型 。 通 常 我 们 想 了 解 的 是 函数 的 参数 (fgets 的 哪 一 个 参数 是 文 
件 指 针 ? ) 或 者 返回 值 (sprintf 返回 的 是 指针 还 是 计数 值 ? ) 。 这 些 函 
数 原型 还 说 明了 要 包含 哪些 头 文件 ， 以 获得 特定 常量 的 定义 ， 或 获得 
ISO C 画 数 原 型 ， 以 帮助 在 编译 时 进行 错误 检测 。 

每 个 函数 原型 的 引用 页 号 出 现在 为 该 函数 列 出 的 第 一 个 头 文件 的 
右边 。 引 用 页 号 提供 的 是 包含 该 函数 原型 的 页 。 为 获得 该 函数 原型 的 
附加 信息 可 参阅 该 页 。 

某 些 函数 原型 仅 受 本 书 说 明 的 4 种 平台 中 某 几 种 的 文 持 。 另 外 ， 有 对 
些 平 台 文 持 的 函数 标志 在 另 一 些 平台 上 并 不 提供 文 持 。 对 于 这 些 情 
况 ， 我 们 通常 列 出 提供 文 持 的 平台 。 但 是 对 于 有 些 情况 ， 我 们 列 出 了 
不 提供 支持 的 平台 。 

本 附录 中 标注 的 页 码 为 英文 版 原 书 的 页 码 ， 与 书 中 页 边 标 注 的 页 码 对 


hy 9 


void abort(void); 
«stdlib.h» p. 365 
此 函数 不 返回 值 


int accept(int sockfd, struct sockaddr *restrict addr, 
Socklen t *restrict len); 
<sys/socket.h> p. 608 
返回 值 : 若 成 功 ， 返 回 文件 〈 套 接 字 ) 描述 符 ， 若 出 错 则 返回 -1 


int access(const char *path, int mode); 
«unistd.h» p. 102 
mode: R OK. W OK. X OK. F OK 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int aio cancel(int fd, struct aiocb *aiocb) ; 
«aio.h» p.514 
返回 值 ， AIO ALLDONE. AIO CANCELED, AIO NOTCANCELED; 若 出 错 ， 返 回 -1 
int aio error(const struct aiocb *aiocb) ; 
«aio.h» p. 513 


返回 值 : 若 操 作成 功 ， 返 回 O0; 若 操作 仍 在 进行 中 ， 返 回 EINPROGRESS; 若 操 
作 失 败 ， 返 回 错误 码 ; 若 出 错 ， 返 回 -1 


int aio fsync(int op, struct aiocb *aiocb); 
«aio.h» p. 513 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 

int aio read(struct aiocb *aiocb); 
«aio.h» p. 512 


返回 值 : 若 成 功 则 ， 返 回 0， 若 出 错 则 返回 -1 


ssize t aio return(const struct aiocb *aiocb) ; 


int 


int 


unsigned 
int 


int 


int 


void 


speed t 


Speed t 


int 


int 


int 


int 


int 


void 


int 


<aio.h> 


返回 值 : 异步 操作 的 结果 ; 若 出 错 ， 返 回 -1 


aio suspend(const struct aiocb *const list[], int nent, 
const struct timespec *timeout) ; 
«aio.h» 


返回 值 : dime»), E 0; Sid, E- 


aio write(struct aiocb *aiocb); 
«aio.h» 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


alarm(unsigned int seconds); 
«unistd.h» 


返回 值 : 0 或 以 前 设置 的 闹钟 时 间 的 余 留 秒 数 


atexit(void (*func) (void)); 
«stdlib.h» 
返回 值 : ARH, AE 0; 若 出 错 ， 返 回 非 0 


bind(int sockfd, const struct sockaddr *addr, socklen t len); 


«sys/socket.h» 


返回 值 : 若 成 功 ， 返 回 0: 若 出 错 ， 返 回 -1 


*calloc(size t nobj, size t size); 
<stdlib.h> 
返回 值 : 若 成 功 ， 返 回 非 空 指针 ; 若 出 错 ， 返 回 NULL 


cfgetispeed(const struct termios *fermptr); 
<termios.h> 


返回 值 ， 返回 波 特 率 值 


cfgetospeed(const struct termios *termptr); 
«termios.h» 


返回 值 : 返回 波 特 率 值 


cfsetispeed(struct termios *termptr, speed t speed); 
«termios.h» 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


cfsetospeed(struct termios *fermptr, speed t speed); 
«termios.h» 


返回 值 : 若 成 功 ， 返 回 0; Ai, E- 


chdir(const char *path); 
«unistd.h» 


返回 值 ， 若 成 功 ， 返 回 0; 若 出错 ， 返 回 -1 


chmod(const char *path, mode t mode); 
<sys/stat.h> 
mode: S IS[UG]ID. S_ISVTX, 
S I[RWX] (USR|GRP|OTH) 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


chown(const char *path, uid t owner, gid t group); 
<unistd.h> 


BEE: FRH, E 0; 若 出错 ， 返 回 -1 


clearerr (FILE *fp); 
<stdio.h> 


clock getres (clockid t clock id, struct timespec *tsp); 


p.513 


p.514 


p.512 


p.338 


p. 200 


p. 604 


p.207 


p. 692 


p. 692 


p. 692 


p. 692 


p. 135 


p. 106 


p. 109 


p. 151 


int 


int 


int 


int 


int 


void 


unsigned 


char 


struct 
cmsghdr 


unsigned 
int 


struct 
cmsghdr 


<sys/time.h> p. 190 
clock_id: CLOCK_REALTIME, CLOCK_MONOTONIC, 

CLOCK PROCESS CPUTIME ID. 

CLOCK THREAD CPUTIME ID 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


clock gettime(clockid t clock id, struct timespec *ísp); 
<sys/time.h> p. 189 
clock id: CLOCK REALTIME. CLOCK_MONOTONIC, 
CLOCK PROCESS CPUTIME ID. 
CLOCK THREAD CPUTIME ID 
返回 值 : 若 成 功 ， 返回 0; 若 出 错 ， 返回 -1 


clock_nanosleep(clockid_t clock id, int flags, 
const struct timespec *reqtp, 
structtimespec *remtp) ; 
«time.h» p. 375 
clock id: CLOCK REALTIME. CLOCK MONOTONIC, 
CLOCK PROCESS CPUTIME ID. 
CLOCK THREAD CPUTIME ID 
flags: TIMER ABSTIME 
返回 值 : 若 休眠 够 要 求 的 时 间 ， 返 回 0， 若 失败 ， 返 回 错误 码 


clock settime(clockid t clock id, const struct timespec *ísp); 
<sys/time.h> p. 190 
clock id: CLOCK REALTIME. CLOCK_MONOTONIC, 
CLOCK PROCESS CPUTIME ID. 
CLOCK THREAD CPUTIME ID 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


close (int fd); 
<unistd.h> p. 66 
BEHA: 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


closedir(DIR *dp); 
«dirent.h» p. 130 
返回 值 ; 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


closelog (void); 
<syslog.h> p. 470 


*CMSG DATA(struct cmsghdr *cp); 
«sys/socket.h» p. 645 
返回 值 : 一 个 指针 ， 指 向 与 cmsghdr 结构 相关 联 的 数据 


*CMSG FIRSTHDR(struct msghdr *mp); 
«sys/socket.h» p. 645 
返回 值 : 一 个 指针 ， 指 向 与 msghdr 结构 相关 联 的 第 一 个 cmsghdr t; 35 
无 这 样 的 结构 ， 返 回 NULL 


CMSG LEN (unsigned int nbytes); 
<sys/socket.h> p. 645 


返回 值 : Ay nbytes 长 的 数据 对 象 分 配 的 长 度 


*CMSG NXTHDR(struct msghdr *mp, struct cmsghdr *cp); 
«sys/socket.h» p. 645 
返回 值 : 一 个 指针 ， 指 向 与 msghdr 结构 相关 联 的 下 一 个 msghdr 结构 , 该 msghar 
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char 


int 


int 
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void 


void 


void 


void 


void 


void 


void 


int 


int 


int 


结构 给 出 了 当前 的 cmsghdr 结构 ; 若 当前 cmsghdr 结构 已 是 最 后 一 


个 ， 返 回 NULL 


connect (int sockfd, const struct sockaddr *addr, 
socklen_t len); 
«sys/socket.h» 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


creat(const char *path, mode t mode); 
«fcntl.h» 
mode: S IS[UG]ID. S_ISVTX, 
S I[RWX] (USR| GRP | OTH) 


返回 值 : 若 成 功 ， 返 回 为 只 写 打 开 的 文件 描述 符 ， 若 出 错 ， 返 回 -1 


*ctermid(char *ptr); 


p. 605 


p. 66 


p. 694 


<stdio.h> 
返回 值 ， 若 成 功 ， 返 回 指向 控制 终端 名 的 指针 ， 若 出 错 ， 返 回 指向 空 字符 串 的 
指针 
dprintf (int fd, const char *restrict format, ...); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 输出 字符 数 ， 若 输出 出 错 ， 返 回 负 值 


dup(int fd); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 新 的 文件 描述 符 ; 若 出 错 ， 返 回 -1 


dup2(int fd, int fd2); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 新 的 文件 描述 符 ， 若 出 错 ， 返 回 -1 


endgrent(void); 
«grp.h» 


endhostent (void); 
«netdb.h» 


endnetent(void); 
«netdb.h» 


endprotoent (void); 
«netdb.h» 


endpwent (void); 
<pwd.h> 


endservent (void) ; 
<netdb.h> 


endspent (void) ; 
<shadow.h> 
平台 : Linux 3.2.0, Solaris 10 


execl(const char *path, const char *arg0, ... /* (char *) 
<unistd.h> 


返回 值 : 若 出 错 ， 返 回 -1; ERY, MEE 


execle(const char *path, const char *arg0, ... /* (char *) 


char *const envp[] */ ); 
«unistd.h» 


返回 值 ， 若 出 错 ， 返 回 -1; 若 成 功 ， 不 返回 


execlp(const char *filename, const char *arg0, 
f* genar *) Q= ys 


p.159 


p. 79 


p.79 
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p. 597 
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p. 599 
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p. 249 
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«unistd.h» 


返回 值 : 若 出 错 ， 返 回 -1; 若 成 功 ， 不 返回 


execv(const char *path, char *const argv[]); 
«unistd.h» 


返回 值 : 若 出 错 ， 返 回 -1;， FRY, MEE 


execve(const char *path , char *const argv[], 
char *const envp[]); 
«unistd.h» 
返回 值 : 若 出 错 ， 返 回 -1;， 若 成 功 ， 不 返回 
execvp(const char *filename, char *const argv[]); 


«unistd.h» 


返回 值 : 若 出 错 ， 返 回 -1; 若 成 功 ， 不 返回 
 Exit(int status); 

<stdlib.h> 

这 个 函数 从 不 返回 
exit (int status) ; 

<unistd.h> 

这 个 函数 从 不 返回 
exit(int status); 


<stdlib.h> 
这 个 函数 从 不 返回 


faccessat (int fd, const char *path, int mode, int flag); 


«unistd.h» 

mode: R OK. W OK. X OK. F OK 

flag: AT EACCESS 

返回 值 : AA, lO; 若 出 错 ， 返 回 -1 


fchdir(int fd); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


fchmod(int fd, mode t mode); 
<sys/stat.h> 
mode: S IS[UG]ID. S_ISVTX, 
S I[RWX] (USR|GRP| OTH) 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


fchmodat(int fd, const char *path, mode t mode, 
<sys/stat.h> 
mode: S IS[UG]ID, S ISVTX, 
S I[RWX] (USR|GRP|OTH) 
flag: AT SYMLINK NOFOLLOW 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


Echown (int fd, uid t owner, gid t group); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


fchownat(int fd, const char *path, uid t owner, 
gid tgroup, int flag); 
«unistd.h» 
flag: AT SYMLINK NOFOLLOW 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
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fclose(FILE *fp); 
«stdio.h» 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 EOF 


fentl(int fd, int cmd, ... /* int arg */ ); 
«fcntl.h» 
cmd: F DUPFD. F DUPFD CLOEXEC. F_GETFD, 
F SETFD. F GETFL. F SETFL. F_GETOWN, 
F SETOWN. F GETLK. F SETLK. F SETLKW 
返回 值 : 若 成 功 ， 依 赖 于 cmd: 若 出 错 ， 返 回 -1 


fdatasync(int fd); 
«unistd.h» 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
平台 : Linux 3.2.0、Solaris 10 


FD CLR(int fd, fd set *fdset); 
<sys/select.h> 


FD ISSET(int fd, fd set *fdset) ; 
«sys/select.h» 


返回 值 : dE fd FERRE, EE Of: 否则 ， 返 回 0 


*fdopen(int fd, const char *type); 
<stdio.h> 
type: aet. "er". "aU. rt, wt", "a+" 


BE: RJ, ESCH, derit. WE NULL 


*fdopendir(int fd); 
<dirent.h> 


返回 值 : ARH, BEKE: FH BE NULL 


FD SET(int fd, fd set *fdset) ; 
«sys/select.h» 


FD ZERO(fd set *fdset) ; 
<sys/select.h> 


feof (FILE *fp); 
<stdio.h> 


返回 值 : 若 到 达 流 的 文件 尾 端 ， 返 回 非 0《〈 真 ) ; 和 否则， 返回 0《〈 假 ) 


ferror(FILE *fp); 
«stdio.h» 


返回 值 : 若 流出 错 ， 返 回 非 0 CAD ; 否则 ,返回 0《〈 假 ) 


fexecve(int fd, char *const argv[], char *const envp[]); 
<unistd.h> 


返回 值 : 若 出 错 ， 返 回 -1， 若 成 功 ， 不 返回 值 


fflush(FILE *fp); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 EOF 


fgetc(FILE *fp); 
«stdio.h» 


p- 


p. 


返回 值 : 若 成 功 ， 返 回 下 一 个 字符 ; 若 已 到 达 文件 尾 端 或 出 错 ， 返 回 EOF 


fgetpos (FILE *restrict fp, fpos t *restrict pos); 
«stdio.h» 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 


*fgets(char *restrict buf, int n, FILE *restrict fp); 
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«stdio.h» 


返回 值 : 若 成 功 ， 返 回 buf; 若 已 到 达 文 件 尾 端 或 出 错 ， 返 回 NULL 


fileno(FILE *fp); 
<stdio.h> 


返回 值 : 与 该 流 相关 联 的 文件 描述 符 ， 若 出 错 ， 返 回 -1 


flockfile(FILE *fp); 
<stdio.h> 


*fmemopen (void *restrict buf, size t size, 
const char *restrict fype); 
«stdio.h» 
type: Wem. Vrat s war. Writ", "ww". "a+" 


返回 值 : 若 成 功 ， 返 回流 指针 ; 若 错误 ， 返 回 NULL 


*fopen(const char *restrict path, const char *restrict fype); 
<stdio.h> 
type: nem Wag, "an. Typ "wt", "a+" 


返回 值 : 若 成 功 ， 返 回 文件 指针 ， 若 出 错 ， 返 回 NULL 


fork (void); 
<unistd.h> 


p. 152 


p. 164 


p. 443 


p.171 


p. 148 


p. 229 


返回 值 : 若 在 子 进程 中 ， 返 回 0; 阁 在 父 进程 中 ， 返 回 子 进程 DD; 若 出 错 ， 返 回 -1 


fpathconf(int fd, int name); 

«unistd.h» 

name: PC ASYNC IO. PC CHOWN RESTRICTED. 
PC FILESIZEBITS. PC LINK MAX. 
_PC MAX CANON. PC MAX INPUT, 
PC NAME MAX. PC NO TRUNC. PC PATH MAX, 
_PC PIPE BUF. PC PRIO IO. PC SYMLINK MAX, 
PC SYNC IO. PC TIMESTAMP RESOLUTION. 
PC 2 SYMLINKS. PC VDISABLE 

返回 值 : 若 成 功 ， 返 回 相 应 值 ; 若 出 错 ， 返 回 -1 


fprintf(FILE *restrict fp, const char *restrict format, ...); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回答 出 字符 数 ， 若 输出 出 错 ， 返 回 负 值 


fputc(int c, FILE *fp); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 c; 若 出 错 ， 返 回 EOF 


fputs(const char *restrict str, FILE *restrict fp); 
<stdio.h> 


返回 值 : FRH, BEJME: 若 出 错 ， 返 回 EOF 


fread(void *restrict ptr, size t size, size t nobj, 
FILE *restrict fp): 
<stdio.h> 


返回 值 : 读 的 对 象 数 


free(void *ptr); 
«stdlib.h» 


freeaddrinfo(struct addrinfo *ai); 
«sys/socket.h» 
«netdb.h» 


p.42 


p. 159 


p. 152 


p. 153 


p. 156 


p. 207 


p. 599 


*freopen (const char *restrict path, const char *restrict fpe, FILE *restrict fp); 


<stdio.h> 


p. 148 


int 


int 


int 


int 


int 


int 


int 


long 


off t 


key t 


int 


int 


void 


int 


int 


type: Py". "Ww", "a", "r+", "wt", "aq" 


返回 值 : 若 成 功 ， 返 回 文件 指针 ; 若 出 错 ， 返 回 NULL 


fscanf(FILE *restrict fp, const char *restrict format, ...); 
«stdio.h» p. 162 
返回 值 : 赋值 的 输入 项 数 ， 若 输入 出 错 或 在 任 一 转换 前 已 到 达 文 件 尾 端 ， 返 回 EOF 


fseek(FILE *fp, long offset, int whence); 
<stdio.h> p. 158 
whence: SEEK SET. SEEK CUR. SEEK END 
返回 值 : AA), JO; A, eE- 


fseeko (FILE *fp, off t offset, int whence); 
<stdio.h> p. 158 
whence: SEEK SET. SEEK CUR. SEEK END 
返回 值 : 若 成 功 ， 返 回 0; A, eE- 


fsetpos(FILE *fp, const fpos t *pos); 
<stdio.h> p. 158 
返回 值 : 若 成 功 ， 返 回 0;， 若 出 错 ， 返 回 非 0 


fstat(int fd, struct stat *buf); 
«sys/stat.h» p. 93 
返回 值 : 若 成 功 ， 返 回 0;， 若 出 错 ， 返 回 非 -1 


fstatat(int fd, const char *restrict path, 
struct stat *restrict buf, int flag); 
«sys/stat.h» p. 93 
flag: AT SYMLINK NOFOLLOW 
返回 值 : AA: 返回 0， 若 出 错 ， 返 回 -1 
fsync(int fd); 
«unistd.h» p. 81 
返回 值 : 若 成 功 ， 返 回 0， 若 出 错 则 返回 -1 


ftell(FILE *fp); 
«stdio.h» p. 158 
返回 值 : 若 成 功 ， 返 回 当前 文件 位 置 指 示 器 ;， 若 出 错 ， 返 回 -1L 


ftello(FILE *fp); 
<stdio.h> p. 158 
返回 值 : 若 成 功 ， 返 回 当前 文件 位 置 指 示 器 ; ATH, AE (off_t)-1 


ftok(const char *path, int id); 
<sys/ipc.h> p. 557 
返回 值 : 若 成 功 ， 返 回 键 ; 若 出 错 ， 返 回 (key t)-1 


ftruncate(int fd, off t length); 
«unistd.h» p. 112 
返回 值 : 若 成 功 ， 返 回 0;， Aw, E-I 


ftrylockfile(FILE *fp); 
«stdio.h» p. 443 
返回 值 : 若 成 功 ， 返 回 0， 若 不 能 获取 锁 ， 返 回 非 0 数值 


funlockfile(FILE *fp); 
«stdio.h» p. 443 


futimens(int fd, const struct timespec fimes[2]); 
«sys/stat.h» p. 126 
返回 值 : 若 成 功 ， 返回 0: 若 出 错 ， 返回 -1 


fwide(FILE *fp, int mode); 


size t 
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char 


gid t 


char 


uid t 
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struct 
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«stdio.h» p. 


<wchar.h> 


144 


返回 值 : ARAN, BEER: ARATE, A; Ate 


未 定向 的 ， 返 回 0 


fwrite(const void *restrict ptr, size t size, size t nobj, 
FILE *restrict fp); 


«stdio.h» P. 


返回 值 ， 写 的 对 象 数 


*gai_strerror (int error); 


<netdb.h> P. 


返回 值 : 指向 描述 错误 的 字符 串 的 指针 


getaddrinfo(const char *restrict host, const char *restrict service, 
const struct addrinfo *restrict hint, 
struct addrinfo **restrict res); 


<sys/socket.h> p. 


«netdb.h» 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 错误 码 


getc(FILE *fp); 


«stdio.h» p- 


返回 值 : 若 成 功 ， 返 回 下 一 个 字符 ; 若 已 到 达 文 件 尾 端 或 出 错 ， 返 回 EOF 


getchar (void); 


«stdio.h» p. 


返回 值 : 若 成 功 ， 返 回 下 一 个 字符 ; 若 已 到 达 文 件 尾 端 或 出 错 ， 返 回 EOF 


getchar unlocked(void); 


«stdio.h» p. 


返回 值 : 若 成 功 ， 返 回 下 一 个 字符 ; 若 已 到 达 文 件 尾 或 者 出 错 ， 返 回 EOF 


getc unlocked(FILE *fp); 


«stdio.h» P. 


返回 值 : 若 成 功 ， 返 回 下 一 个 字符 ， 若 已 到 达 文件 尾 或 者 出 错 ， 返 回 EOF 


*getcwd(char *buf, size t size); 


«unistd.h» P. 


返回 值 : 若 成 功 ， 返 回 buf Fit, E NULL 
getegid (void); 


<unistd.h> p. 


返回 值 : 调用 进程 的 有 效 组 ID 


*getenv(const char *name) ; 


«stdlib.h» p. 


返回 值 : 指向 与 name 关联 的 value 的 指针 ; BARE, Ie] NULL 


geteuid (void); 


«unistd.h» p- 


返回 值 : 调用 进程 的 有 效用 户 ID 
getgid (void); 


«unistd.h» P. 


返回 值 : 调用 进程 的 实际 组 ID 


*getgrent (void); 


<grp.h> p. 


返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 或 到 达 文 件 尾 端 ， 返 回 NULL 
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*getgrgid(gid t gid); 
«grp.h» 
返回 值 : 若 成 功 ， 返 回 指 针 ， 若 出 错 ， 返 回 NULL 


*getgrnam(const char *name); 
«grp.h» 
返回 值 : 若 成 功 ， 返 回 指针 ; Sidi. E NULL 


getgroups (int gidsetsize, gid t grouplist[]) ; 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 附属 组 ID 数量 ;， 若 出 错 ， 返 回 -1 


*gethostent (void); 
«netdb.h» 
返回 值 : 若 成 功 ， 返 回 指 针 ， 若 出 错 ， 返 回 NULL 


gethostname (char *name, int namelen) ; 
«unistd.h» 


返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


*getlogin (void); 
«unistd.h» 


p. 182 


p. 182 


p.184 


p. 597 


p. 188 


p.275 


返回 值 : 若 成 功 ， 返 回 指 向 登录 名 字符 串 的 指针 ， uf. Jail NULL 


getnameinfo(const struct sockaddr *restrict addr, 

socklen t alen, char *restrict host, 

socklen t hostlen, char *restrict service, 

socklen t servien, unsigned int flags); 

<sys/socket.h> 

<netdb.h> 

flags: NI DGRAM. NI NAMEREQD. NI NOFQDN. 
NI NUMERICHOST. NI NUMERICSCOPE. 
NI NUMERICSERV 

返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 非 0 fü 


*getnetbyaddr(uint32 t net, int type); 
«netdb.h» 
返回 值 : ERY, BEHEE: Sri, E NULL 


*getnetbyname (const char *name); 
«netdb.h» 
返回 值 : FRY, BEE: dif, 2E] NULL 


*getnetent (void); 
«netdb.h» 
返回 值 : 若 成 功 ， 返 回 指针 ， 若 出 错 ， 返 回 NULL 


getopt(int argc, char * const argv[], const char *options) ; 
«fcntl.h» 
extern int opterr, optind, optopt; 
extern char *optarg; 


返回 值 ， 下 一 个 选项 字符 ， 若 所 有 选项 被 处 理 完 ， 返 回 -1 


getpeername (int sockfd, struct sockaddr *restrict addr, 
socklen t *restrict alenp) ; 


p. 600 


p. 598 


p. 598 


p. 598 
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pid t 


pid t 


pid t 
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struct 
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int 


<sys/socket.h> 
getpgid(pid t pid); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 进程 组 ID; 若 出 错 ， 返 回 -1 


getpgrp (void); 
«unistd.h» 


返回 值 : 调用 进程 的 进程 组 ID 


getpid(void); 
«unistd.h» 


返回 值 : 调用 进程 的 进程 人 


getppid (void); 
<unistd.h> 


返回 值 : 调用 进程 的 父 进程 ID 


getpriority(int which, id t who); 
<sys/resource.h> 
which: PRIO PROCESS. PRIO PGRP、 PRIO USER 


返回 值 ， 若 成 功 ， 返 回 -NZERO~NZERO-1 的 nice 值 ; 


*getprotobyname (const char *name); 
<netdb.h> 
返回 值 : ARH, BeSt Ai, El NULL 


*getprotobynumber (int proto); 
<netdb.h> 
返回 值 : 若 成 功 ， 返 回 指针 ;， 若 出 错 ， 返 回 NULL 


*getprotoent (void); 
«netdb.h» 
返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 


*getpwent (void); 
«pwd.h» 


返回 值 : 若 成 功 ， 返 回 指针 ， 若 出 错 或 到 达 文 件 尾 端 ， 返 回 NULL 


*getpwnam(const char *name) ; 
«pwd.h» 
返回 值 : 若 成 功 ， 返 回 指针 ， 若 出 错 ， 返 回 NULL 


$ 


*getpwuid(uid t uid); 
<pwd.h> 
返回 值 : 若 成 功 ， 返 回 指针 ;， 若 出 错 ， 返 回 NULL 


getrlimit(int resource, struct rlimit *rlptr); 
«sys/resource.h» 
resource: RLIMIT CORE, RLIMIT CPU, 
RLIMIT DATA, RLIMIT FSIZE, 
RLIMIT NOFILE, RLIMIT STACK, 
RLIMIT AS (FreeBSD 8.0, Linux 3.2.0. 
Solaris 10) , 


RLIMIT MEMLOCK (FreeBSD 8.0. Linux 3.2.0, 


ind 
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ZIT 
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pid t 
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struct 
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int 


Mac OS X 10.6.8) , 
RLIMIT MSGQUEUE (Linux 3.2.0) , 
RLIMIT NICE (Linux 3.2.0) , 
RLIMIT NPROC (FreeBSD 8.0, Linux 3.2.0, 
Mac OS X 10.6.8) , 
RLIMIT NPTS (FreeBSD 8.0) , 
RLIMIT RSS (FreeBSD 8.0. Linux 3.2.0, 
MacOS X 10.68) , 
RLIMIT SBSIZE (FreeBSD 8.0) , 
RLIMIT SIGPENDING (Linux 3.2.0) , 
RLIMIT SWAP (FreeBSD 8.0) , 
RLIMIT VMEM (Solaris 10) 
返回 值 : 若 成 功 ， 返 回 0;， 若 出 错 ， 返 回 -1 


*gets(char *buf); 
<stdio.h> 


返回 值 : FRJ, BE buf; 若 已 到 达 文件 尾 端 或 出 错 ， 返 回 NULL 


*getservbyname(const char *name, const char *proto); 
<netdb.h> 
返回 值 : ARJ, BEKE: Fit, AE NULL 


*getservbyport(int port, const char *proto); 
«netdb.h» 
返回 值 : 若 成 功 ， 返 回 指针 ， 若 出 错 ， 返 回 NULL 


*getservent (void); 
«netdb.h» 
返回 值 : ARH, BEME: 若 出 错 ， 返 回 NULL 


getsid(pid t pid); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 会 话 首 进程 的 进程 组 ID; 若 出 错 ， 返 回 -1 


getsockname (int sockfd, struct sockaddr *restrict addr, 
socklen t *restrict alenp); 
«sys/socket.h» 


getsockopt(int sockfd, int level, int option, void *restrict val, 
Socklen t *restrict lenp); 
«sys/socket.h» 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


*getspent(void); 
<shadow.h> 
返回 值 : FRJ, BEJE: AH, E NULL 
平台 : Linux 3.2.0, Solaris 10 


*getspnam(const char *name) ; 
<shadow.h> 
返回 值 : 若 成 功 ， 返 回 指针 ， 若 出 错 ， 返 回 NULL 
平台 : Linux 3.2.0、Solaris 10 


gettimeofday (struct timeval *restrict tp, 
void *restrict tp); 
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«sys/time.h» 


返回 值 : 总 是 返回 0 


getuid (void); 
«unistd.h» 


返回 值 : 调用 进程 的 实际 用 户 ID 


*gmtime (const time t *calptr) ; 
«time.h» 


返回 值 : 指向 分 解 的 tm 结构 的 指针 ;， 若 出 错 ， 返 回 NULL 


grantpt(int fd); 
<stdlib.h> 
返回 值 : AM, lO; 若 出 错 ， 返 回 -1 


htonl(uint32 t hostint32) ; 
«arpa/inet.h» 


返回 值 : 以 网 络 字 节 序 表示 的 32 位 整数 


htons(uint16 t hostintl6) ; 
«arpa/inet.h» 


返回 值 ， 以 网 络 字 节 序 表示 的 16 位 整数 


*inet ntop(int domain, const void *restrict addr, 
char *restrict str, socklen t size); 
«arpa/inet.h» 


返回 值 : 若 成 功 ， 返 回 地址 字符 串 指针 ;， 若 出 错 ， 返 回 NULL 


inet pton(int domain, const char *restrict str, 
void *restrict addr); 
«arpa/inet.h» 


返回 值 : 若 成 功 ， 返 回 1， 若 格式 无 效 ， 返 回 0， 若 出 错 ， 返 回 -1 


initgroups (const char *username, gid t basegid); 
<grp.h> /* Linux & Solaris */ 
<unistd.h> /* FreeBSD & Mac OS X */ 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


ioctl(int fd, int request, ...); 
<unistd.h> /* System V */ 
«sys/ioctl.h» /* BSD and Linux */ 
返回 值 : 若 出 错 ， 返 回 -1; 若 成 功 ， 返 回 其 他 值 


isatty(int fd); 
<unistd.h> 


返回 值 : 若 为 终端 设备 ， 返 回 » ( 真 ) ; 否则 ， 返 回 0( 假 ) 


kill(pid t pid, int signo); 

<signal.h> 

返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
lchown(const char *path, uid t owner, gid t group); 


«unistd.h» 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


link(const char *existingpath, const char *newpath) ; 
<unistd.h> 


BREE: 若 成 功 ， 返 回 0; FE, E- 


linkat (int efd, const char *existingpath, int nfd, 
const char *newpath, int flag); 
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«unistd.h» 
flag: AT SYMLINK NOFOLLOW 
返回 值 : AAMT, HO; 若 出 错 ， 返 回 -1 


lio listio(int mode, struct aiocb *restrict const list[restrict], 


int nent, struct sigevent *restrict sigev); 


«aio.h» 
mode: LIO NOWAIT. LIO WAIT 
返回 值 : 若 成 功 ， 返回 0; 若 出 错 ， 返回 -1 


listen(int sockd, int backlog); 
«sys/socket.h» 


BEE: ARH, BE 0; 若 出 错 ， 返 回 -! 


*localtime (const time t *calptr); 
«time.h» 


返回 值 : 指向 分 解 的 tm 结构 的 指针 ;， 若 出 错 ， 


longjmp(jmp buf env, int val); 
<setjmp.h> 


这 个 函数 不 返回 


lseek(int fd, off t offset, int whence); 
«unistd.h» 
whence: SEEK SET. SEEK CUR. SEEK END 


返回 NULL 


返回 值 : AM, Ct; 若 出 错 ， 返 回 -1 


lstat(const char *restrict path, struct stat *restrict buf); 


«sys/stat.h» 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


*malloc(size t size); 
<stdlib.h> 


返回 值 : 若 成 功 ， 返 回 非 空 指针 ， 若 出 错 ， 返 回 NULL 


mkdir(const char *path, mode t mode); 
«sys/stat.h» 
mode: S IS[UG]ID. S ISVTX. 
S I[RWX] (USR| GRP|OTH) 
返回 值 : 若 成 功 ， 返 回 0， 基 出错， 返回 -1 


mkdirat(int fd, const char *path, mode t mode); 
«sys/stat.h» 
mode: S IS[UG]ID. S_ISVTX, 
S I[RWX] (USR|GRP|OTH) 
返回 值 : ARH, BE o 若 出 错 ， 返 回 -1 


*mkdtemp (char *femplate) ; 
«stdlib.h» 
返回 值 : AM, RRA ARAN, At 


mkfifo(const char *path, mode t mode); 
«sys/stat.h» 
mode: S IS[UG]ID. S ISVTX. 
S I[RWX] (USR|GRP|OTH) 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


mkfifoat(int fd, const char *path, mode t mode); 
<sys/stat.h> 
mode: S IS[UG]ID. S_ISVTX, 
S I[RWX] (USR|GRP|OTH) 


Hf, JI] NULL 
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返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


mkstemp (char *femplate) ; 
<stdlib.h> 
返回 值 : 若 成 功 ， 返 回 文件 描述 符 ， 若 出 错 ， 返 回 -1 


mktime (struct tm *tmptr); 
«time.h» 


返回 值 : AAR, IAAI, 车 出 错 ， 返 回 -1 


*mmap (void *addr, size t len, int prot, int flag, int fd, 
off t off) ; 
<sys/mman.h> 
prot: PROT READ. PROT WRITE. PROT EXEC. PROT NONE 
flag: MAP FIXED. MAP SHARED. MAP PRIVATE 


返回 值 : 若 成 功 ， 返 回 映 射 区 的 起 始 地 址 ， 若 出 错 ， 返 回 MAP FAILED 


mprotect(void *addr, size t len, int prot); 
<sys/mman.h> 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
msgctl(int msqid, int cmd, struct msqid ds *buf); 
«sys/msg.h» 
cmd: IPC STAT. IPC SET. IPC RMID 
返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


msgget(key t key, int flag); 
«sys/msg.h» 
flag: IPC CREAT. IPC EXCL 
返回 值 : 若 成 功 ， 返 回 消息 队列 ID; 若 出 错 ， 返 回 -1 


msgrcv(int msqid, void *ptr, size t nbytes, long type, int flag); 
<sys/msg.h> 
flag: IPC NOWAIT. MSG NOERROR 
返回 值 : 若 成 功 ， 返 回 消息 数据 部 分 的 长 度 ; 若 出 错 ， 返 回 -1 


msgsnd(int msqid, const void *ptr, size t nbytes, int flag); 
«sys/msg.h» 
flag: IPC NOWAIT 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


msync(void *addr, size t len, int flags); 
«sys/mman.h» 
flag: MS ASYNC. MS INVALIDATE. MS SYNC 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


munmap(void *addr, size t len); 
<sys/mman.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -! 


nanosleep(const struct timespec *reqtp, 
struct timespec *remip); 
«time.h» 


返回 值 : 若 休 了 眠 够 要 求 的 时 间 ， 返 回 0， 若 出 错 ， 返 回 -1 


nice(int incr); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 新 的 nice 值 减 掉 NzERO: 车 出 错 ， 返 回 -1 


ntohl(uint32 t nmetint32) ; 
<arpa/inet.h> 


返回 值 : 以 主机 字 节 序 表示 的 32 位 整数 


p. 169 


p. 192 


p. 525 


p.527 


p. 562 


p.562 


p. 564 


p. 563 


p. 528 


p.528 


p.374 


p. 276 


p. 594 


uintl6 t ntohs (uintl6 t netint/6) ; 


<arpa/inet.h> p. 594 
返回 值 : 以 主机 字 节 序 表示 的 16 位 整数 
int open(const char *path, int oflag, ... /* mode t mode */ ); 
«fcntl.h» p.62 
oflag: O RDONLY. O WRONLY,. O_RDWR. O EXEC. 
O SEARCH; 


O APPEND. O CLOEXEC. O CREAT. 
O DIRECTORY. O DSYNC. O EXCL, 
O NOCTTY. O NOFOLLOW. O NONBLOCK. 
O RSYNC. O SYNC. O TRUNC. O TTY INIT 
mode: S IS[UG]ID. S ISVTX. 
S I[RWX] (USR|GRP| OTH) 
返回 值 ， 车 成 功 ， 返 回 文件 描述 符 ， 若 出 错 ， 返 回 -1 
平台 : {E FreeBSD 8.0 fil Mac OS X 10.6.8 中 还 有 一 个 0. FSYNC 标志 


int openat(int fd, const char *path, int oflag, ... 
/* mode t mode */ ); 
«fcntl.h» p.62 
oflag: O RDONLY. O WRONLY. O_RDWR, O EXEC. 
O SEARCH; 


O APPEND. O CLOEXEC. O CREAT, 
O DIRECTORY. O DSYNC. O EXCL, 
O NOCTTY. O NOFOLLOW. O NONBLOCK. 
O RSYNC. O SYNC. O TRUNC. O TTY INIT 
mode: S IS[UG]ID. S ISVTX. 
S I[RWX] (USR|GRP | OTH) 
返回 值 : 若 成 功 ， 返 回 文件 描述 符 ; 若 出 错 ， 返 回 -1 
平台 : 在 FreeBSD 8.0 和 Mac OS X 10.6.8 中 还 有 一 个 Q_FSYNC 标志 


DIR *opendir(const char *path); 
«dirent.h» p. 130 
返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 

void openlog(const char *ident, int option, int facility) ; 
<syslog.h> p. 470 


option: LOG CONS. LOG NDELAY. LOG NOWAIT. 
LOG ODELAY. LOG PERROR. LOG PID 
facility: LOG AUTH. LOG AUTHPRIV. LOG CRON. 
LOG DAEMON. LOG FTP. LOG KERN, 
LOG LOCAL[0-7]. LOG LPR. LOG MAIL. 
LOG NEWS. LOG SYSLOG. LOG USER. LOG UUCP 


FILE *open memstream(char **bufp, size t *sizep); 
<stdio.h> p. 173 
返回 值 ， 若 成 功 ， 返 回流 指针 ;， 若 出 错 ， 返 回 NULL 

FILE *open wmemstream(wchar t **bufp, size t *sizep); 
<wchar.h> p. 173 
返回 值 ， 若 成 功 ， 返 回流 指针 ， 若 出 错 ， 返 回 NULL 

long pathconf (const char *path, int name); 
<unistd.h> p.42 


name: PC ASYNC IO. PC CHOWN RESTRICTED. 
.PC FILESIZEBITS. PC LINK MAX. 
.PC MAX CANON. PC MAX INPUT, 
.PC NAME MAX. PC NO TRUNC. PC PATH MAX, 
.PC PIPE BUF. PC PRIO IO. PC SYMLINK MAX. 


int 


int 


void 


int 


int 


FILE 


int 


ssize t 


int 


int 


void 


void 


int 


int 


.PC SYNC IO. PC TIMESTAMP RESOLUTION. 
.PC 2 SYMLINKS. PC VDISABLE 
返回 值 ， 若 成 功 ， 返 回 相应 值 ， 若 出 错 ， 返 回 -1 


pause (void); 
«unistd.h» 


返回 值 : -1, errno 设置 为 EINTR 


pclose (FILE *fp); 
<stdio.h> 


p. 338 


p.541 


返回 值 : 若 成 功 ， 返 回 popen 函数 中 emdstring 的 终止 状态 ， 车 出 错 ， 返 回 -1 


perror(const char *msg); 
«stdio.h» 


pipe(int fd[2]); 
«unistd.h» 


返回 值 : 车 成 功 ， 返回 0; 若 出 错 ， 返回 -1 


poll(struct pollfd fdarray[], nfds t nfds, int timeout) ; 
«poll.h» 
返回 值 : 准备 就 绪 的 描述 符 数 ， 若 超时 ， 返 回 0; 若 出 错 ， 返 回 -1 


*popen(const char *cmdstring, const char *type); 
<stdio.h> 
type: " 2 aL " "Ww" 


返回 值 ， 若 成 功 ， 返 回 文件 指针 ， 若 出 错 ， 返 回 NULL 


posix openpt(int oflag); 
<stdlib.h> 
«fcntl.h» 
oflag: O RWDR. O NOCTTY 


p. 15 


p.535 


p. 506 


p.541 


p.722 


返回 值 : 若 成 功 ， 返 回 下 一 个 可 用 的 PTY 主 设备 文件 描述 符 ; 若 出 错 ， 返 回 -1 


pread(int fd, void *buf, size t nbytes, off t offset); 
«unistd.h» 


返回 值 : 读 到 的 字 节 数 ， 若 已 到 达 文 件 尾 端 ， 返 回 0; 若 出 错 ， 返 回 -1 


printf(const char *restrict format, ...); 
<stdio.h> 


返回 值 : 车 成 功 ， 返 回 输出 字符 数 ， 车 输出 出 错 ， 返 回 负 值 


pselect(int maxfdpl, £d set *restrict readfds, 
fd set *restrict writefds, fd set *restrict exceptfds, 
const struct timespec *restrict (sptr, 
const sigset t *restrict sigmask); 
<sys/select.h> 


返回 值 : 准备 就 绪 的 描述 符 数 ; 若 超时 ， 返 回 0; 若 出 错 ， 返 回 -1 


psiginfo(const siginfo t *info, const char *msg); 
<signal.h> 


psignal (int signo, const char *msg); 
<signal.h> 
<siginfo.h> /* on Solaris */ 


pthread_atfork (void (*prepare) (void), void (*parent) (void), 
void (*child) (void) ); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则， 返回 错误 编号 


pthread attr destroy(pthread attr t *attr); 
<pthread.h> 


p. 78 


p. 159 


p. 506 


p. 379 


p. 379 


p. 458 


p. 427 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


pthread attr getdetachstate (const pthread attr t *attr, 
int *detachstate) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread attr getguardsize(const pthread attr t 
*restrict attr, 
size t *restrict guardsize) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 
pthread attr getstack(const pthread attr t *restrict attr, 
void **restrict stackaddr, 
size t *restrict stacksize) ; 
<pthread.h> 
返回 值 : AMY, BIO; 和 否则， 返回 错误 编号 
pthread attr getstacksize(const pthread attr t 
*restrict attr, 
size t *restrict stacksize) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread attr init(pthread attr t *attr) ; 
<pthread.h> 
BEHE: ARI, RE 0; 否则 ， 返 回 错误 编号 


pthread attr setdetachstate(pthread attr t *attr, 
int detachstate) ; 
<pthread.h> 
detachstate: PTHREAD CREATE DETACHED, 
PTHREAD CREATE JOINABLE 
返回 值 : 车 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread attr setguardsize(pthread attr t *attr, 
size t guardsize); 
«pthread.h» 
返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


pthread attr setstack(const pthread attr t *attr, 
void *stackaddr, size t *stacksize) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


pthread attr setstacksize(pthread attr t *attr, 
size t stacksize) ; 
«pthread.h» 
返回 值 : 若 成 功 ， 返 回 0， 和 否则， 返回 错误 编号 


pthread barrierattr destroy(pthread barrierattr t *attr); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread barrierattr getpshared(const pthread barrierattr t 
*restrict attr, 
int *restrict pshared); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


pthread barrierattr init(pthread barrierattr t *attr); 


p. 428 


p. 430 


p. 429 


p. 430 


p.427 


p.428 


p. 430 


p. 429 


p. 430 


p. 441 


p. 441 


«pthread.h» p. 441 
返回 值 : 若 成 功 ， 返 回 O; 和 否则， 返回 错误 编号 


int pthread barrierattr setpshared(pthread barrierattr t *attr, 
int pshared) ; 
<pthread.h> p. 441 
pshared: PTHREAD PROCESS PRIVATE. 
PTHREAD PROCESS SHARED 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


int pthread barrier destroy(pthread barrier t *barrier); 
<pthread.h> p. 418 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 

int pthread barrier init(pthread barrier t *restrict barrier, 


constpthread barrierattr t 
*restrict attr, 
unsigned int count); 


<pthread.h> p.418 
返回 值 : 若 成 功 ， 返 回 0; 否则， 返回 错误 编号 

int pthread barrier wait(pthread barrier t *barrier); 
<pthread.h> p. 419 


返回 值 : 若 成 功 ， 返 回 0 或 者 PTHREAD BARRIER SERIAL THREAD; 
和 否则， 返回 错误 编号 


int pthread cancel(pthread t tid); 
«pthread.h» p. 393 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 
Void pthread cleanup pop (int execute); 
<pthread.h> p. 394 
void pthread_cleanup_push(void (*rin) (void *), void *arg); 
<pthread.h> p. 394 
int pthread condattr destroy (pthread condattr t *attr); 
<pthread.h> p. 440 
返回 值 ， 若 成 功 ， 返 回 0， 和 否则， 返回 错误 编号 
int pthread condattr getclock(const pthread condattr t 


*restrict attr, 
clockid t *restrict clock id); 


<pthread.h> p. 441 
返回 值 : 车 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 
int pthread condattr getpshared(const pthread condattr t 


*restrict attr, 
int *restrict pshared); 


<pthread.h> p. 440 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 
int pthread condattr init(pthread condattr t *attr); 
<pthread.h> p. 440 
返回 值 : 若 成 功 ， 返 回 FU, BERRA 
int pthread condattr setclock(pthread condattr t *attr, 
clockid t clock id) ; 
<pthread.h> p. 441 


返回 值 : 若 成 功 ， 返 回 0; 否则， 返回 错误 编号 


int pthread condattr setpshared(pthread condattr t *attr, 


int 


int 


int 


int 


int 


int 


int 


int 


int 


void 


void 


int 


int 


int pshared) ; 
<pthread.h> 
pshared: PTHREAD PROCESS PRIVATE, 
PTHREAD PROCESS SHARED 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread cond broadcast (pthread cond t *cond) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread cond destroy (pthread cond t *cond); 
<pthread.h> 


pthread_cond_init (pthread cond t *restrict cond, 


const pthread_condattr_t *restrict attr); 


<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread cond signal(pthread cond t *cond); 
<pthread.h> 
WHA: 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread cond timedwait(pthread cond t *restrict cond, 
pthread mutex t *restrict mutex, 


const struct timespec 
*restrict timeout) ; 
«pthread.h» 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread cond wait(pthread cond t *restrict cond, 


pthread mutex t *restrict mutex); 


«pthread.h» 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread create (pthread t *restrict tidp, 
const pthread attr t *restrict attr, 
void *(*start rtn) (void *), 
void *restrict arg); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 
pthread detach(pthread t tid); 


<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread equal(pthread t tidl, pthread t tid2); 
<pthread.h> 


返回 值 : 车 相等 ， 返 回 非 0 数值， 否则 ， 返 回 0 


pthread exit(void *rval ptr) ; 
<pthread.h> 


*pthread_getspecific (pthread key t key); 
<pthread.h> 


返回 值 : 线程 特定 数据 值 ， 若 没有 值 与 该 键 关联 ， 返 回 NULL 


pthread join(pthread t thread, void **rval ptr) ; 
«pthread.h» 
返回 值 : 若 成 功 ， 返 回 0;， 否则， 返回 错误 编号 


pthread key create(pthread key t *kevp, 


p. 440 


p.415 


p.414 


p.414 


p.415 


p. 414 


p.414 


p.385 


p. 397 


p.385 


p. 389 


p. 449 


p. 389 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


void (*destructor) (void *)); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; AM, BERS 


pthread key delete(pthread key t Key); 
<pthread.h> 
lA: 若 成 功 ， 返 回 O; 和 否则， 返回 错误 编号 


pthread kill(pthread t thread, int signo); 
<signal.h> 


返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread mutexattr destroy(pthread mutexattr t *attr); 
«pthread.h» 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread mutexattr getpshared(const pthread mutexattr t 
*restrict attr, 
int *restrict pshared) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则， 返回 错误 编号 


pthread mutexattr getrobust(const pthread mutexattr t 
*restrict attr, 
int *restrict robust); 
<pthread.h> 
返回 值 : FRJ, BE 0 否则， 返回 错误 编号 
pthread mutexattr gettype(const pthread mutexattr t 
*restrict atír, 
int *restrict type); 
«pthread.h» 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread mutexattr init(pthread mutexattr t *attr); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread mutexattr setpshared(pthread mutexattr t *attr, 
int pshared) ; 
<pthread.h> 
pshared: PTHREAD PROCESS PRIVATE. 
PTHREAD PROCESS SHARED 
返回 值 ， 车 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread mutexattr setrobust(pthread mutexattr t *attr, 
int robust); 
<pthread.h> 
robust: PTHREAD MUTEX ROBUST. 
PTHREAD MUTEX STALLED 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread mutexattr settype(pthread mutexattr t *attr, int type); 
<pthread.h> 
type: PTHREAD MUTEX NORMAL, 
PTHREAD MUTEX ERRORCHECK. 
PTHREAD MUTEX RECURSIVE. 
PTHREAD_MUTEX_DEFAULT 
返回 值 : 若 成 功 ， 返 回 0， 和 否则， 返回 错误 编号 


pthread mutex consistent(pthread mutex t *mutex); 
<pthread.h> 


p. 447 
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p. 431 


p. 432 
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p.431 
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p.432 
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int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


返回 值 : 若 成 功 ， 返 回 0: 和 否则， 返回 错误 编号 


pthread mutex destroy(pthread mutex t *mutex) ; 
<pthread.h> 
IBM: 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


pthread mutex init(pthread mutex t *restrict mutex, 
const pthread mutexattr t *restrict attr); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


pthread mutex lock(pthread mutex t *mutex); 
«pthread.h» 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错 误 编号 


pthread_mutex_timedlock (pthread mutex t *restrict mutex, 
const struct timespec *restrict (sptr); 
«pthread.h» 
«time.h» 


返回 值 : 若 成 功 则 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


pthread mutex trylock(pthread mutex t *multex); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


pthread mutex unlock(pthread mutex t *mutex) ; 
<pthread.h> 


返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


pthread once(pthread once t *initflag, void (*initfn) (void) ); 
<pthread.h> 
pthread once t initflag= PTHREAD ONCE INIT; 
返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


pthread rwlockattr destroy (pthread rwlockattr t *attr); 
«pthread.h» 
返回 值 : 若 成 功 ， 返 回 0;， 和 否则， 返回 错误 编号 


pthread rwlockattr getpshared(const pthread rwlockattr t 
*restrict attr, 
int *restrict pshared); 
<pthread.h> 
返回 值 ; FRY, EO; 否则 ， 返 回 错误 编号 


pthread rwlockattr init(pthread rwlockattr t *attr); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则， 返回 错误 编号 


pthread rwlockattr setpshared(pthread rwlockattr t *attr, 
int pshared) ; 
<pthread.h> 
pshared: PTHREAD_PROCESS_PRIVATE, 
PTHREAD PROCESS SHARED 
返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


pthread rwlock destroy (pthread rwlock t *rwlock); 
«pthread.h» 
返回 值 : FRH, HILO; ATI, BEERA S 


pthread_rwlock_init (pthread rwlock t *restrict rwlock, 
const pthread rwlockattr t 
*restrict attr); 


p. 400 


p. 400 


p. 400 


p. 407 


p. 400 


p. 400 


p. 448 


p. 439 


p. 440 


p. 439 


p. 440 


p. 409 


«pthread.h» p. 409 
返回 值 : 车 成 功 ， 返 回 0;， 否则， 返回 错误 编号 


int pthread rwlock rdlock(pthread rwlock t *rwlock); 
<pthread.h> p. 410 
返回 值 : 若 成 功 ， 返 回 0;， 否则 ， 返 回 错误 编号 

int pthread rwlock timedrdlock(pthread rwlock t *restrict rwlock, 


const struct timespec 
*restrict tsptr); 
«pthread.h» p.413 
<time.h> 


返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


int pthread rwlock timedwrlock(pthread rwlock t *restrict rwlock, 
const struct timespec 
*restrict ¢sptr); 


<pthread.h> p. 413 
<time.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则， 返回 错误 编号 

int pthread rwlock tryrdlock(pthread rwlock t *rwlock); 
<pthread.h> p. 410 
返回 值 ; 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 

int pthread rwlock trywrlock(pthread rwlock t *rwlock); 
<pthread.h> p. 410 
返回 值 ， 若 成 功 ， 返 回 0;， 否则， 返回 错误 编号 

int pthread rwlock unlock(pthread rwlock t *rwlock); 
«pthread.h» p.410 
返回 值 ， 车 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 

int pthread rwlock wrlock(pthread rwlock t *rwlock); 
<pthread.h> p. 410 


返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 
pthread t pthread self (void); 


<pthread.h> p. 385 
返回 值 : 调用 线程 的 线程 ID 
int pthread setcancelstate(int state, int *oldstate); 
«pthread.h» p. 451 


state: PTHREAD CANCEL ENABLE, 
PTHREAD CANCEL DISABLE 
返回 值 ， 车 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


int pthread setcanceltype (int type, int *oldtype) ; 
<pthread.h> p. 453 
type: PTHREAD CANCEL DEFERRED, 
PTHREAD_CANCEL_ASYNCHRONOUS 
返回 值 : AR, EO; 否则， 返回 错误 编号 


int pthread setspecific(pthread key t key, const void *value); 
<pthread.h> p. 449 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


int pthread sigmask(int how, const sigset t *restrict set, 
sigset t *restrict oset); 
<signal.h> p. 454 
how: SIG BLOCK. SIG UNBLOCK, SIG SETMASK 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


int 


int 


int 


int 


int 


void 


char 


int 


int 


int 


int 


int 


int 


ssize t 


int 


ssize t 


pthread spin destroy (pthread spinlock t *lock) ; 
«pthread.h» 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread spin init(pthread spinlock t *lock, int pshared) ; 
<pthread.h> 
pshared: PTHREAD PROCESS PRIVATE. 
PTHREAD PROCESS SHARED 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread spin lock(pthread spinlock t */ock); 
<pthread.h> 
返回 值 : AY, EO: 否则 ， 返 回 错 误 编号 


pthread spin trylock (pthread spinlock t *lock) ; 
«pthread.h» 
返回 值 : 若 成 功 ， 返 回 0; 否则， 返回 错误 编号 


pthread spin unlock(pthread spinlock t *lock); 
«pthread.h» 


返回 值 : 若 成 功 ，; 


pthread testcancel (void); 
<pthread.h> 


0; 否则 ， 返 回 错误 编号 


Er 
回 


*ptsname (int fd); 
<stdlib.h> 


返回 值 : 若 成 功 ， 返 回 指向 PTY 从 设备 名 的 指针 ; 若 出 错 ， 返 回 NULL 


putc(int c, FILE *fp); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 c; 若 出 错 ， 返 回 EOF 


putchar(int c); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 c; 若 出 错 ， 返 回 EOF 


putchar unlocked(int c); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 c; 若 出 错 ， 返 回 EOF 


putc unlocked(int c, FILE *fp); 
<stdio.h> 


返回 值 : ARH, BRE c; 若 出 错 ， 返 回 EOF 


putenv(char *str); 
<stdlib.h> 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 


puts(const char *str); 
«stdio.h» 


返回 值 : 若 成 功 ， 返 回 非 负 值 ; 若 出 错 ， 返 回 EOF 


pwrite(int fd, const void *buf, size t nbytes, off t offset); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 已 写 的 字 节 数 ; 若 出 错 ， 返 回 -1 


raise(int signo); 
<signal.h> 


返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


read(int fd, void *buf, size t nbytes); 
«unistd.h» 


p.417 


p.417 


p.418 


p.418 


p.418 


p. 453 


p. 723 


p. 152 


p. 152 


p.444 


p.444 


p.212 


p. 153 


p. 78 


p. 337 


p. 71 


struct 


dirent 


ssize t 


ssize t 


ssize t 


void 


ssize t 


ssize t 


ssize t 


返回 值 ， 读 到 的 字 节 数 ; 若 已 到 达 文 件 尾 端 ， 返回 o; 若 出 错 ， 返 回 -1 


*readdir (DIR *dp); 
«dirent.h» 


返回 值 ; 若 成 功 ， 返 回 指针 ， 若 在 目录 尾 或 出 错 ， 返 回 NULL 


readlink(const char *restrict path, char *restrict buf, 
size t bufsize); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 读 取 的 字 节 数 ; 若 出 错 ， 返 回 -1 


readlinkat(int fd, const char* restrict path, 
char *restrict buf, size t bufsize); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 读 取 的 字 节 数 ， 若 出 错 ， 返 回 -1 


readv(int fd, const struct iovec *iov, int iovent) ; 
<sys/uio.h> 


返回 值 : AA, IIMS, ui Ae- 


*realloc(void *ptr, size t newsize) ; 
<stdlib.h> 
返回 值 : 若 成 功 ， 返 回 非 空 指针 ， 若 出 错 ， 返 回 NULL 


recv(int sockfd, void *buf, size t nbytes, int flags); 
«sys/socket.h» 
flags: MSG PEEK, MSG OOB, MSG WAITALL, 
MSG CMSG CLOEXEC (Linux 3.2.0) , 
MSG DONTWAIT (FreeBSD 8.0. Linux 3.2.0. 
Solaris 10) , 
MSG ERRQUEUE (Linux 3.2.0) , 
MSG TRUNC (Linux 3.2.0) 


返回 值 ， 数 据 的 字 节 长 度 ， 若 无 可 用 数据 或 对 等 方 已 经 按 序 结束 ， 返 回 0; 


若 出 错 ， 返 回 -1 


recvfrom(int sockfd, void *restrict buf, size t len, int flags, 


struct sockaddr *restrict addr, 
socklen t *restrict addrlen) ; 
<sys/socket.h> 
flags: MSG_PEEK, MSG_OOB, MSG WAITALL, 
MSG CMSG CLOEXEC (Linux 3.2.0) , 
MSG DONTWAIT (FreeBSD 8.0. Linux 3.2.0. 
Solaris 10) , 
MSG ERRQUEUE (Linux 3.2.0) , 
MSG_TRUNC (Linux 3.2.0) 


p. 130 


p. 123 


p. 123 


p. 521 


p. 207 


p. 612 


p. 613 


返回 值 : 数据 的 字 节 长 度 ， 若 无 可 用 数据 或 对 等 方 已 经 按 序 结束 ， 返 回 0; 


若 出 错 ， 返 回 -1 


recvmsg(int sockfd, struct msghdr *msg, int flags); 

«sys/socket.h» 

flags: MSG PEEK, MSG OOB, MSG WAITALL, 
MSG CMSG CLOEXEC (Linux3.2.0) , 
MSG DONTWAIT (FreeBSD 8.0. Linux 3.2.0. 

Solaris 10) , 

MSG ERRQUEUE (Linux 3.2.0) , 
MSG_TRUNC (Linux 3.2.0) 


p. 613 


返回 值 : 数据 的 字 节 长 度 ， 若 无 可 用 数据 或 对 等 方 已 经 按 序 结束 ， 返 回 0; 


若 出 错 ， 返 回 -1 


int 


int 


int 


void 


void 


int 


int 


void 


int 


int 


int 


int 


int 


int 


int 


remove (const char *path) ; 
«stdio.h» p. 119 
返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


rename (const char *oldname, const char *newname) ; 
<stdio.h> p. 119 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


renameat(int oldfd, const char *oldname, int newfd, 
const char *newname) ; 
<stdio.h> p. 119 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


rewind(FILE *fp); 


<stdio.h> p. 158 
rewinddir (DIR *dp); 

<dirent.h> p. 130 
rmdir (const char *path) ; 

<unistd.h> p. 130 

返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
scanf(const char *restrict format, ...); 

<stdio.h> p. 162 


返回 值 : 赋值 的 输入 项 数 ， 若 输入 出 错 或 在 任 一 转换 前 已 到 达 文 件 尾 端 ， 返 回 EOF 


seekdir(DIR *dp, long loc); 
«dirent.h» p. 130 


select(int maxfdpl, fd set *restrict readfds, 
fd set *restrict writefds, fd set *restrict exceptfds, 
struct timeval *restrict typtr); 
<sys/select.h> p. 502 
返回 值 : 准备 就 绪 的 描述 符 数 ， 若 超时 ， 返 回 0; 若 出 错 ， 返 回 -1 


sem close(sem t *sem); 
<semaphore.h> p. 580 
返回 值 : 若 成 功 ， 返 回 0;， 若 出 错 ， 返 回 -1 


semctl(int semid, int semnum, int cmd, 
/* union semun arg */ ); 
«sys/sem.h» p. 567 
cmd: IPC STAT. IPC SET. IPC RMID. GETPID, 
GETNCNT. GETZCNT, GETVAL. SETVAL, 
GETALL. SETALL 
返回 值 : 《返回 值 取决 于 命令 ) ; 若 出 错 ， 返 回 -1 


sem destroy(sem t *sem); 
<semaphore.h> p. 582 
返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


semget(key t key, int nsems, int flag); 
<sys/sem.h> p. 567 
flag: IPC_CREAT, IPC EXCL 
返回 值 : 若 成 功 ， 返 回信 号 量 ID: 若 出 错 ， 返 回 -1 


sem getvalue(sem t *restrict sem, int *restrict valp); 
<semaphore.h> p. 582 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


sem init(sem t *sem, int pshared, unsigned int value); 
<semaphore.h> p. 582 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int semop(int semid, struct sembuf semoparray[], size t nops); 
<sys/sem.h> 
返回 值 : 若 成 功 ， 返 回 0; FR, E- 
sem t *sem open(const char *name, int oflag, ... /* mode t mode, 
unsigned int value */ ); 
<semaphore.h> 


flag: IPC_CREAT, IPC EXCL 


返回 值 : 若 成 功 ， 返 回 指 向 信号 量 的 指针 ; 若 出 错 ， 返 回 SEM FAILED 


int sem post(sem t *sem); 
<semaphore.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int sem timedwait(sem t *restrict sem, 
const struct timespec *restrict (sptr); 
<semaphore.h> 
<time.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int sem trywait(sem t *sem); 
<semaphore.h> 


返回 值 ; 着 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int sem unlink(const char *name) ; 
<semaphore.h> 


返回 值 : ARY, BE o Fit, BE- 


int sem wait(sem t *sem); 
<semaphore.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


ssize t send(int sockfd, const void *buf, size t nbytes, int flags); 
«sys/socket.h» 
flags: MSG EOR, MSG OOB, MSG NOSIGNAL, 
MSG CONFIRM (Linux 3.2.0) , 
MSG DONTROUTE (FreeBSD 8.0. Linux 3.2.0, 
Mac OS X 10.6.8. Solaris 10) , 
MSG DONTWAIT (FreeBSD 8.0, Linux 3.2.0. 
Mac OS X 10.6.8. Solaris 10) , 
MSG EOF (FreeBSD 8.0, Mac OS X 10.6.8) , 
MSG MORE (Linux 3.2.0) 
返回 值 : 若 成 功 ， 返 回 发 送 的 字 节 数 ;， 若 出 错 ， 返 回 -1 


ssize t sendmsg(int sockfd, const struct msghdr *msg, int flags); 
<sys/socket.h> 
flags: MSG_EO, MSG_OOB, MSG NOSIGNAL, 
MSG CONFIRM (Linux 3.2.0) , 
MSG DONTROUTE (FreeBSD 8.0, Linux 3.2.0. Mac OS X 10.6.8. 
Solaris 10) , 
MSG DONTWAIT (FreeBSD 8.0, Linux 3.2.0. Mac OS X 10.6.8, 
Solaris 10) , 
MSG_EOF (FreeBSD 8.0, Mac OS X 10.6.8) , 
MSG MORE (Linux 3.2.0) 
返回 值 : 若 成 功 ， 返 回 发 送 字 节 数 ; 若 出 错 ， 返 回 -1 


ssize t sendto(int sockfd, const void *buf, size t nbytes, int flags, 
const struct sockaddr *destaddr, socklen t destlen) ; 
<sys/socket.h> 


p. 568 


p.579 


p.582 


p.581 


p. 581 


p. 580 


p. 581 


p. 610 


p.611 


p.610 


void 


int 


int 


int 


int 


void 


int 


void 


int 


int 


void 


int 


int 


void 


void 


flags: MSG EOR, MSG OOB, MSG NOSIGNAL, 
MSG CONFIRM (Linux 3.2.0) , 


MSG _DONTROUTE (FreeBSD 8.0, Linux 3.2.0. Mac OS X 10.6.8, Solaris 10), 
MSG DONTWAIT(FreeBSD 8.0, Linux 3.2.0. Mac OS X 10.6.8, Solaris 10), 


MSG EOF (FreeBSD 8.0. Mac OS X 10.6.8) , 
MSG MORE (Linux 3.2.0) 
返回 值 : 若 成 功 ， 返 回 发 送 的 字 节 数 ， 若 出 错 ， 返 回 -1 


setbuf(FILE *restrict fp, char *restrict buf); 
<stdio.h> 


setegid(gid t gid); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


setenv(const char *name, const char *value, int rewrite); 
«stdlib.h» 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


seteuid(uid t uid); 
«unistd.h» 


返回 值 : 若 成 功 ， 返回 0; 若 出 错 ， 返回 -1 


setgid(gid t gid); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 0 若 出 错 ， 返 回 -1 


setgrent (void); 
<grp.h> 


setgroups (int ngroups, const gid t grouplist[1) ; 
«grp.h» /* Linux */ 
«unistd.h» /* FreeBSD, Mac OS X, and Solaris */ 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


sethostent(int stayopen) ; 
«netdb.h» 


setjmp(jmp buf env); 
<setjmp.h> 


返回 值 : 若 直接 调用 ， 返 回 0; AM longjmp 返回 ， 返 回 非 0 


setlogmask(int maskpri) ; 
<syslog.h> 
返回 值 : 前 日 志 记录 优先 级 屏蔽 字 值 


setnetent(int stayopen) ; 
«netdb.h» 


setpgid(pid t pid, pid t pgid) ; 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 0; hH, BE- 


setpriority(int which, id t who, int value); 
«sys/resource.h» 
which: PRIO PROCESS. PRIO PGRP. PRIO USER 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


setprotoent(int sf/ayopen); 
«netdb.h» 


setpwent (void); 
<pwd.h> 


p. 146 


p. 258 


p. 212 


p. 258 


p. 256 


p. 183 


p. 184 


p. 597 


p.215 


p. 470 


p. 598 


p.294 


p.277 


p. 598 


p. 180 


int 


int 


int 


void 


pid t 


int 


void 


int 


int 


void 


setregid(gid t rgid, gid t egid); 
«unistd.h» 


返回 值 : AA, ILO; AHH, E- 


setreuid(uid t ruid, uid t euid); 
«unistd.h» 


返回 值 : ARH, BRE 0; 若 出 错 ， 返 回 -1 


setrlimit(int resource, const struct rlimit *riptr); 
<sys/resource.h> 
resource: RLIMIT CORE, RLIMIT CPU, 
RLIMIT DATA, RLIMIT FSIZE, 
RLIMIT NOFILE. RLIMIT STACK, 
RLIMIT AS (FreeBSD 8.0, Linux 3.2.0, 
Solaris 10) , 
RLIMIT MEMLOCK (FreeBSD 8.0, Linux 3.2.0, 
Mac OS X 10.6.8) , 
RLIMIT MSGQUEUE (Linux 3.2.0) , 
RLIMIT NICE (Linux3.2.0) , 
RLIMIT NPROC (FreeBSD 8.0, Linux 3.2.0, 
MacOS X 10.6.8) , 
RLIMIT NPTS (FreeBSD 8.0) , 
RLIMIT RSS (FreeBSD 8.0. Linux 3.2.0, 
Mac OS X 10.6.8) , 
RLIMIT SBSIZE (FreeBSD 8.0) , 
RLIMIT SIGPENDING (Linux3.2.0) , 
RLIMIT SWAP (FreeBSD 8.0) , 
RLIMIT VMEM (Solaris 10) 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


setservent (int sfayopen) ; 
«netdb.h» 


setsid(void); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 进程 组 ID; 若 出 错 ， 返 回 -1 


setsockopt(int sockfd, int level, int option, const void *val, 
socklen t len); 
<sys/socket.h> 


返回 值 : 若 成 功 ， 返回 0; 若 出 错 ， 返回 -1 


setspent (void); 
<shadow.h> 
平台 : Linux 3.2.0. Solaris 10 


setuid(uid t uid); 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


setvbuf(FILE *restrict fp, char *restrict buf, int mode, 
size t size); 
<stdio.h> 
mode: IOFBF. IOLBF. _IONBF 
返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 


*shmat(int shmid, const void *addr, int flag); 
«sys/shm.h» 
flag: SHM RND. SHM RDONLY 
返回 值 ， 若 成 功 ， 返 回 指向 共享 存储 段 的 指针 ， 若 出 错 ， 返 回 -1 


p.257 


p.257 


p.220 


p. 599 


p.295 


p. 624 


p.182 


p.256 


p. 146 


p.574 


int shmctl(int shmid, int cmd, struct shmid ds *buf); 
«sys/shm.h» p. 573 
cmd: IPC STAT, IPC SET, IPC RMID, 
SHM LOCK (Linux 3.2.0. Solaris 10) , 
SHM UNLOCK (Linux 3.2.0, Solaris 10) 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int shmdt(const void *addr); 
<sys/shm.h> p. 574 
返回 值 : 若 成 功 ， 返 回 0， 和 若 出 错 ， 返 回 -1 

int shmget(key t key, size t size, int flag); 
<sys/shm.h> p. 572 


flag: IPC CREAT,. IPC EXCL 
返回 值 : 若 成 功 ， 返 回 非 负 共享 存储 ID; 若 出 错 ， 返 回 -1 


int shutdown (int sockfd, int how); 
<sys/socket.h> p. 592 
how: SHUT RD. SHUT WR. SHUT RDWR 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int sig2str(int signo, char *str); 
<signal.h> p. 380 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
平台 : Solaris 10 


int sigaction (int signo, const struct sigaction *restrict act, 
struct sigaction *restrict oact); 

<signal.h> p. 350 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 

int sigaddset(sigset t *set, int signo); 
<signal.h> p. 344 
IMA: 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 

int sigdelset(sigset t *set, int signo); 
«signal.h» p.344 
返回 值 : 若 成 功 ， 返 回 0;， 若 出 错 ， 返 回 -1 

int sigemptyset(sigset t *sef); 
<signal.h> p. 344 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 

int sigfillset(sigset t *sef); 
<signal.h> p. 344 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 

int Sigismember (const sigset t *set, int signo); 
<signal.h> p. 344 
返回 值 : 若 真 ， 返 回 1; 若 假 ， 返 回 0; 若 出 错 ， 返 回 -1 

void siglongjmp(sigjmp buf env, int val); 
<setjmp.h> p. 356 
此 函数 不 返回 

void (*signal (int signo, void (*func) (int))) (int); 
<signal.h> p. 323 
返回 值 : 若 成 功 ， 返 回 以 前 的 信号 处 理 配置 ， 若 出 错 ， 返 回 SIG ERR 

int sigpending(sigset t *set); 
<signal.h> p. 347 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
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int 


int 


int 


int 
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int 


int 


int 


int 


int 


int 


int 


int 


int 


sigprocmask(int how, const sigset t *restrict set, 
sigset t *restrict oset); 
<signal.h> p. 346 
how: SIG BLOCK. SIG UNBLOCK, SIG SETMASK 
返回 值 : 若 成 功 ， 返 回 0; FHH, E- 


sigqueue(pid t pid, int signo, const union sigval value) 
<signal.h> p. 376 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


sigsetjmp(sigjmp buf env, int savemask) ; 
<setjmp.h> p. 356 
返回 值 : 若 直 接 调 用 ， 返 回 0; 若 从 siglongjmp 调用 返回 ， 返 回 非 0 值 


sigsuspend(const sigset t *sigmask); 
<signal.h> p. 359 
返回 值 : -1, errno 设置 为 EINTR 


sigwait(const sigset t *restrict sef, int *restrict signop); 
<signal.h> p. 454 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


sleep(unsigned int seconds); 
<unistd.h> p. 373 
返回 值 : 0 或 未 休眠 的 秒 数 


snprintf(char *restrict buf, size t n, 
const char *restrict format, ...); 
<stdio.h> p. 159 
返回 值 : 若 缓 冲 区 足够 大 ， 返 回 存 入 数组 的 字符 数 ， 若 编码 出 错 ， 返 回 负 值 


sockatmark(int sockfd) ; 
<sys/socket.h> p. 626 
返回 值 : 若 在 标记 处 ， 返 回 1; 着 没 在 标记 处 ， 返 回 0; 若 出 错 ， 返 回 -! 


socket(int domain, int type, int protocol); 
<sys/socket .h> p. 590 
type: SOCK STREAM. SOCK DGRAM. SOCK SEQPACKET 
返回 值 : 若 成 功 ， 返 回 文件 〈 套 接 字 ) 描述 符 ， 着 出 错 ， 返 回 -1 


socketpair(int domain, int type, int protocol, int sockfd[2]); 
<sys/socket .h> p. 630 
type: SOCK STREAM. SOCK_DGRAM, SOCK SEQPACKET 
返回 值 : 若 成 功 ， 返 回 0; 若 出错 ， 返 回 -1 


sprintf(char *restrict buf, const char *restrict format, ...); 
<stdio.h> p. 159 
返回 值 : 若 成 功 ， 返 回 存 入 数组 的 字符 数 ， 若 编码 出 错 ， 返 回 负 值 


sscanf(const char *restrict buf, 
const char *restrict format, ...); 
<stdio.h> p. 162 
返回 值 : 赋值 的 输入 项 数 ， 若 答 入 出 错 或 在 任 一 转换 前 已 到 达 文 件 尾 端 ， 返 回 EOF 


stat(const char *restrict path, struct stat *restrict buf); 
«sys/stat.h» p.93 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


str2sig(const char *str, int *signop); 
<signal.h> p. 380 
返回 值 : 车 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
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void 
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f: Solaris 10 


*strerror(int errnum); 


<string.h> 


返回 值 : 指向 消息 字符 串 的 指针 


strftime(char *restrict buf, size t maxsize, 
const char *restrict format, 
const struct tm *restrict tmptr); 
«time.h» 


返回 值 : 若 有 空间 ， 返 回 存 入 数组 的 字符 数 ;， 和 否则， 返回 0 


strftime 1 (char *restrict buf, size t maxsize, 
const char *restrict format, 
const struct tm *restrict tmptr, locale t locale); 
«time.h» 


返回 值 : 若 有 空间 ， 返 回 存 入 数组 的 字符 数 ， 和 否则， 返回 0 


*strptime(const char *restrict buf, const char *restrict format, 


struct tm *restrict tmptr); 
«time.h» 


返回 值 : 指向 上 次 解析 的 字符 的 下 一 个 字符 的 指针 ;和 否则， 返回 NULL 


*strsignal(int signo); 
<string.h> 


返回 值 : 说 明 该 信号 字符 串 的 指针 


symlink (const char *actualpath, const char *sympath); 
«unistd.h» 


返回 值 : FRH, BE Oo 若 出 错 ， 返 回 -1 


symlinkat(const char *actualpath, int fd, const char *sympath) ; 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


sync(void); 
«unistd.h» 


sysconf(int name); 

<unistd.h> 

name: SC ARG MAX, SC ASYNCHRONOUS IO. 
.SC ATEXIT MAX. SC BARRIERS, 
.SC CHILD MAX. SC CLK TCK. 
.SC CLOCK SELECTION. SC COLL WEIGHTS MAX. 
SC DELAYTIMER MAX. SC HOST NAME MAX. 
SC IOV MAX. SC JOB CONTROL. 
SC LINE MAX. SC LOGIN NAME MAX, 
.SC MAPPED FILED. SC MEMORY PROTECTION, 
.SC NGROUPS MAX, SC OPEN MAX, 
.SC PAGESIZE. SC PAGE SIZE. 
.SC READER WRITER LOCKS. 
.SC REALTIME SIGNALS. SC RE DUP MAX. 
.SC RTSIG MAX. SC SAVED IDS. 
.SC SEMAPHORES. SC SEM NSEMS MAX, 
.SC SEM VALUE MAX. SC SHELL. 
SC SIGQUEUE MAX. SC SPIN LOCKS, 
SC STREAM MAX. SC SYMLOOP MAX. 
.SC THREAD SAFE FUNCTIONS. 
SC THREADS. SC TIMER MAX. 
.SC TIMERS. SC TTY NAME MAX. 


p.15 


p. 192 


p. 192 


p. 195 


p. 380 


p. 123 


p. 123 


p. 81 


p. 42 


OOV tawarin MAAS 9U VINO LUN 
.SC XOPEN CRYPT. SC XOPEN REALTIME,. 
.SC XOPEN REALTIME THREADS. SC XOPEN SHM 
_SC XOPEN VERSION 

返回 值 : 若 成 功 ， 返 回 相应 值 ， 若 出 错 ， 返 回 -1 


void syslog(int priority, char *format, ...); 
«syslog.h» p. 470 


int system(const char *cmdstring) ; 
<stdlib.h> p. 265 
返回 值 : shell 的 终端 状态 


int tcdrain(int fd); 
«termios.h» p. 693 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int tcflow(int fd, int action); 
<termios.h> p. 693 
action; TCOOFF. TCOON, TCIOFF. TCION 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int tcflush(int fd, int queue); 
«termios.h» p. 693 
queue: TCIFLUSH, TCOFLUSH. TCIOFLUSH 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int tcgetattr(int fd, struct termios *termptr); 
«termios.h» p. 683 
返回 值 : 若 成 功 ， 返 回 0; Aht, E- 

pid t tcgetpgrp(int fd); 
«unistd.h» p. 298 
返回 值 : 若 成 功 ， 返 回 前 台 进程 组 ID; 若 出 错 ， 返 回 -1 

pid t tcgetsid(int fd); 
«termios.h» p. 299 
返回 值 : 若 成 功 ， 返 回 会 话 首 进程 的 进程 组 ID;， 若 出 错 ， 返 回 -1 

int tcsendbreak(int fd, int duration) ; 
«termios.h» p. 693 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 

int tcsetattr(int fd, int opt, const struct termios *fermptr); 
«termios.h» p. 683 


opt: TCSANOW. TCSADRAIN. TCSAFLUSH 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
int tcsetpgrp(int fd, pid t pgrpid); 


<unistd.h> p. 298 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


long telldir(DIR *dp); 
«dirent.h» p. 130 
返回 值 : 与 dp 关联 的 目录 中 的 当前 位 置 


time t time(time t *calptr) ; 
«time.h» p.189 
返回 值 : 若 成 功 ， 返 回 时 间 值 ; 若 出 错 ， 返 回 -1 


clock t times(struct tms *buf); 
«sys/times.h» p. 280 
返回 值 : 若 成 功 ， 经 过 的 墙 上 时 钟 时 间 ; 若 出 错 ， 返 回 -1 
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int 
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*tmpfile (void); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 文件 指针 ; 若 出 错 ， 返 回 NULL 


*tmpnam(char *ptr); 
<stdio.h> 


返回 值 : 指向 唯一 路 径 名 的 指针 ， 若 出 错 ， 返 回 NULL 


truncate(const char *path, off t length); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


*ttyname(int fd); 
<unistd.h> 


返回 值 : 指向 终端 路 径 名 的 指针 ; 若 出 错 ， 返 回 NULL 


umask (mode t cmask) ; 
<sys/stat.h> 


返回 值 : 之 前 的 文件 模式 创建 屏蔽 字 


uname(struct utsname *name) ; 
«sys/utsname.h» 


返回 值 : 若 成 功 ， 返 回 非 负 值 ; 若 出 错 ， 返 回 -1 


ungetc(int c, FILE *fp); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 c; 若 出 错 ， 返 回 EOF 


unlink(const char *path); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


unlinkat(int fd, const char *path, int flag); 
«unistd.h» 
flag: AT REMOVEDIR 
返回 值 : 若 成 功 ， 返 回 0; Fit, Re- 


unlockpt(int fd); 
<stdlib.h> 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


unsetenv(const char *name); 
<stdlib.h> 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


utimensat(int fd, const char *path, 
const struct timespec times[2], int flag); 
«sys/stat.h» 
flag: AT SYMLINK NOFOLLOW 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


utimes (const char *path, const struct timeval times[2]); 
«sys/time.h» 


返回 值 : 车 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


vdprintf(int fd, const char *restrict format, va list arg); 


<stdarg.h> 
<stdio.h> 


返回 值 ， 若 成 功 ， 返 回 输出 字符 数 ， 若 输出 出 错 ， 返 回 负 值 


vfprintf(FILE *restrict fp, const char *restrict format, 


va list arg); 


p. 167 


p. 167 


p.112 


p. 695 
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p. 117 
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p. 212 
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<stdarg.h> p. 161 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 箱 出 字符 数 ; 若 输出 出 错 ， 返 回 负 值 


vfscanf(FILE *restrict fp, const char *restrict format, va list arg); 
<stdarg.h> p. 163 
<stdio.h> 


返回 值 : 指定 的 输入 项 目 数 ， 若 输入 出 错 或 在 任 一 转换 前 文件 结束 ， 返 回 EOF 


vprintf(const char *restrict format, va list arg); 
<stdarg.h> p. 161 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回答 出 字符 数 : 若 输出 出 错 ， 返 回 负 值 


vscanf(const char *restrict format, va list arg); 
«stdarg.h» p. 163 
«stdio.h» 


返回 值 : 指定 的 输入 项 目 数 ， 若 输入 出 错 或 在 任 一 转换 前 文件 结束 ， 返 回 EOF 


vsnprintf (char *restrict buf, size t n, 
const char *restrict format, va list arg); 
<stdarg.h> p. 161 
<stdio.h> 


返回 值 : 若 缓冲 区 足够 大 ， 返 回 存 入 数组 的 字符 数 ， 若 编码 出 错 ， 返 回 负 值 


vsprintf(char *restrict buf, const char *restrict format, 
va list arg); 
<stdarg.h> p. 161 
<stdio.h> 


返回 值 ; 若 成 功 ， 返 回 存 入 数组 的 字符 数 ; 若 编码 出 错 ， 返 回 负 值 


vsscanf(const char *restrict buf, const char *restrict format, 
va list arg); 
<stdarg.h> p. 163 
<stdio.h> 


返回 值 ， 指定 的 输入 项 目 数 ， 若 输入 出 错 或 在 任 一 转换 前 文件 结束 ， 返 回 EOF 


vsyslog(int priority, const char *format, va list arg); 
<syslog.h> p. 472 
<stdarg.h> 
平台 : FreeBSD 8.0, Linux 3.2.0. Mac OS X 10.6.8, Solaris 10 


wait(int *statloc) ; 
<sys/wait.h> p. 238 
返回 值 : ARH, BREEF ID: 若 出 错 ， 返 回 0 或 -1 


waitid(idtype t idtype, id t id, siginfo t *infop, int options); 
<sys/wait.h> p. 244 
idtype: P PID. P_PGID, P ALL 
options: WCONTINUED. WEXITED. WNOHANG. WNOWAIT. WSTOPPED 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


台 : Linux 3.2.0、Solaris 10 


waitpid(pid t pid, int *statloc, int options) ; 
«sys/wait.h» p.238 
options: WCONTINUED. WNOHANG. WUNTRACED 
返回 值 : 若 成 功 ， 返 回 进程 ID; 若 出 错 ， 返 回 0 或 -1 

wait3(int *statloc, int options, struct rusage *rusage); 


<sys/types.h> p. 245 
<sys/wait.h> 


pid t 


ssize t 


ssize t 


<sys/time.h> 

<sys/resource.h> 

options: WNOHANG. WUNTRACED 

返回 值 ， 若 成 功 ， 返 回 进程 DD; 若 出 错 ， 返 回 0 或 -1 

平台 : FreeBSD 8.0、Linux 3.2.0, Mac OS X 10.6.8、Solaris 10 


wait4 (pid t pid, int *statloc, int options, struct rusage *rusage); 


write (int fd, 


<sys/types.h> 

<sys/wait.h> 

<sys/time.h> 

<sys/resource.h> 

options: WNOHANG, WUNTRACED 

返回 值 : 若 成 功 ， 返 回 进程 D; 若 出 错 ， 返 回 0 或 -1 

平台 : FreeBSD 8.0、Linux 3.2.0. Mac OS X 10.6.8、Solaris 10 


const void *buf, size t nbytes); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 已 写 的 字 节 数 ， 若 出 错 ， 返 回 -1 


writev(int fd, const struct iovec *iov, int iovent) ; 


<sys/uio.h> 


返回 值 : 若 成 功 ， 返 回 已 写 的 字 节 数 ， 若 出 错 ， 返 回 -1 


p. 245 


p.72 


p. 521 


B JE RH 


B.1 本 书 使 用 的 头 文件 

本 书 中 的 大 多 数 程序 都 包含 头 文件 apue.h， 如 图 B-1 所 示 。 其 中 定 
SOY fi (如 MAXLINE) 和 我 们 目 编 函 数 的 原型 。 

大 多 数 程序 都 需要 包含 下 列 头 文件 : <stdio.h> ` <stdlib.h> (其 中 
有 exit 函 数 原 型 ) 和 <unistd.h> (其 中 包含 所 有 标准 UNIX 函 数 的 原 
59) ， 因 此 头 文件 apue.h 目 动 包含 了 这 些 系统 头 文件 ， 同 时 还 包含 了 
<string.h>。 这 样 就 减少 了 本 书 中 所 有 程序 的 长 度 。 


/* 
* Our own header, to be included before all standard system headers. 
y 

#ifndef  APUE H 

#define APUE H 


#define POSIX C SOURCE 200809L 


#if defined (SOLARIS) /* Solaris: T0 */ 
#define XOPEN SOURCE 600 

#else 

#define XOPEN SOURCE 700 

fendif 

#include <sys/types.h> /* some systems still require this */ 
#include <sys/stat.h> 

#include <sys/termios.h> /* for winsize */ 

fif defined(MACOS) || !defined(TIOCGWINSZ) 

#include <sys/ioctl.h> 

#endif 

#include <stdio.h> /* for convenience */ 
#include <stdlib.h> /* for convenience */ 
#include <stddef.h> /* for offsetof */ 
#include <string.h> /* for convenience */ 
#include <unistd.h> /* for convenience */ 
#include <signal.h> /* for SIG_ERR */ 


#define MAXLINE 4096 /* max line length */ 


/* 


* Default file access permissions for new files. 


wif! 
#define FILE MODE (S_IRUSR | S IWUSR | S IRGRP | S IROTH) 
/* 
* Default permissions for new directories. 
wif 
#define DIR MODE (FILE MODE | S IXUSR | S IXGRP | S IXOTH) 
typedef void Sigfunc(int);/* for signal handlers */ 
#define min(a,b) ((ay € (by ? (ay : by 
#define max(a,b) ((a) > (b) ? (a) : (b)) 
/* 
* Prototypes for our own functions. 
x 
char *path alloc(size t *); /* Figure 2.16 */ 
long open max (void); /* Figure 2.17 */ 
int set cloexec (int); /* Figure 13.9 */ 
void cle fl (int, int); 
void set_fl(int, int); /* Figure 3.12 */ 
void pr_exit (int); /* Figure 8.5 */ 
void pr_mask(const char *); /* Figure 10.14 */ 
Sigfunc *signal_intr(int, Sigfunc *); /* Figure 10.19 */ 
void daemonize(const char *); /* Figure 13.1 */ 
void Sleep us(unsigned int); /* Exercise 14.5 */ 
ssizet readn(int, void *, size t); /* Figure 14.24 */ 
ssize t writen(int, const void *, size t); /* Figure 14.24 */ 
int fd pipe(int *); /* Figure 17.2 */ 
int recv fd(int, ssize t (*func) (int, 

const void *, size t)); /* Figure 17.14 */ 
int send fd(int, int); /* Figure 17.13 */ 
int send err(int, int, 

onst char *); /* Figure 17.12 */ 
int serv listen(const char *); /* Figure 17.8 */ 
int serv accept(int, uid t *); /* Figure 17.9 */ 
int cli conn(const char *); /* Figure 17.10 */ 
int buf args(char *, int (*func) (int, 

char **)ys /* Figure 17.23 */ 
int tty cbreak (int); /* Figure 18.20 */ 
int tty raw(int); /* Figure 18.20 */ 
int tty reset (int); /* Figure 18.20 */ 
void tty atexit (void); /* Figure 18.20 */ 
struct termios *tty termios (void); /* Figure 18.20 */ 


int ptym open(char *, int); /* Figure 19.9 */ 


int ptys open(char *); /* Figure 19.9 */ 
#ifdef TIOCGWINSZ 


pid t pty fork(int *, char *, int, const struct termios *, 

const struct winsize *); /* Figure 19.10 */ 
fendif 
int lock reg(int, int, int, off t, int, off t); /* Figure 14.5 */ 


#define read lock(fd, offset, whence, len) \ 

lock reg((fd), F SETLK, F RDLCK, (offset), (whence), (len)) 
#define readw lock(fd, offset, whence, len) \ 

lock reg((fd), F SETLKW, F RDLCK, (offset), (whence), (len)) 
#define write lock(fd, offset, whence, len) \ 

lock reg((fd), F SETLK, F WRLCK, (offset), (whence), (len)) 
#define writew lock(fd, offset, whence, len) \ 

lock reg((fd), F SETLKW, F WRLCK, (offset), (whence), (len)) 
$define un lock(fd, offset, whence, len) \ 

lock reg((fd), F SETLK, F UNLCK, (offset), (whence), (len)) 


pid t lock test(int, int, off t, int, off t); /* Figure 14.6 */ 


#define is read lockable(fd, offset, whence, len) \ 


(lock test((fd), F RDLCK, (offset), (whence), (len)) -- O0) 
#define is write lockable(fd, offset, whence, len) \ 
(lock test((fd), F WRLCK, (offset), (whence), (len)) == 0) 
void err msg(const char *, ...); /* Appendix B */ 
void err dump(const char *, ...) | attribute ((noreturn)); 
void err quit(const char *, ...) attribute ((noreturn)); 
void err cont(int, const char *, ...); 
void err exit(int, const char *, ...) attribute ((noreturn)); 
void err ret(const char *, ...); 
void err sys(const char *, ...) attribute ((noreturn)); 
void log msg(const char *, ...); /* Appendix B */ 
void log open(const char *, int, int); 
void log quit(const char *, ...) | attribute ((noreturn)); 
void log ret(const char *, ...); 
void log sys(const char *, ...) attribute ((noreturn)); 
void log exit(int, const char *, ...) attribute ((noreturn)); 
void TELL WAIT (void); /* parent/child from Section 8.9 */ 
void TELL PARENT (pid t); 
void TELL CHILD (pid t); 
void WAIT PARENT (void); 
void WAIT CHILD (void); 


#endif /* _APUE_H */ 


图 B-1 头 文件 apue.h 


程序 中 先 包括 apueh, A BEELTE — RR ZEE OCE, ORE RE 
们 易于 做 到 下 列 各 点 : 可 以 移 定 义 一 些 在 此 后 包括 的 头 文 件 可 能 要 求 
的 部 分 ， 能 够 控制 头 文件 被 包括 的 顺序 ; 能够 重 定义 某 些 部 分 ， 而 这 
正 是 为 隐藏 两 个 系统 之 间 的 差别 而 需要 解决 的 。 

B.2 标准 出 错 例 程 

我 们 提供 了 两 套 出 错 函 数 ， 用 于 本 书 中 大 多 数 实例 以 处 理 各 种 出 
错 情况 。 一 套 以 err_ 开 头 ， 并 癌 标 准 错 误 输 出 一 条 出 错 消 息 。 男 一 僚 以 
log 开头 ， 用 于 守护 进程 ( 见 第 13 章 ) ， 它 们 多 半 没 有 控制 终端 。 

之 所 以 提供 我 们 目 己 鸭 出 钳 函 数 ， 是 为 了 能 够 编写 只 有 一 行 C 代 码 
的 出 错 处 理 程序 ， 例 如 : 

if (HH EET T) 

err_dump( 带 任意 参数 的 printf 格 式 ); 

这 样 就 不 再 需要 使 用 下 列 代码 : 


if (出 错 条 件 ) { 
char buf[200]; 
sprintf(buf, 带 任意 参数 的 printf 格 式 ); 
perror(buf); 
abort(); 
} 


我 们 的 出 错 处 理 函 数 使 用 了 ISO C 的 变 长 参数 表 功 能 。 其 详细 说 
明 见 Kernighan 和 Ritchie[1988] 的 7.3 节 。 应 当 注 意 的 是 ， 这 个 ISO CH 
能 与 早期 系统 (如 SVR3 和 4.3BSD) 提供 的 varargs 功 能 不 同 。 宏 的 名 字 
相同 ， 但 更 改 了 某 些 宏 的 参数 。 

图 B-2 列 出 了 各 个 出 错 函 数 之 间 的 区 别 。 


abort(); 
exit(1); 


err dump 
err exit 
err msg return; 
exvE(l)s 
return; 
exit (1); 


return; 


err quit 
err ret 
err Sys 
err cont 
return; 
exit (2); 
return; 
exit (2); 
exit (2); 


是 
是 
4 
a 
是 
是 
是 
a 
f 
是 
是 
是 


图 B-2 标准 出 错 函 数 
图 B-3 包 括 了 输出 至 标准 错误 的 各 个 出 错 函 数 。 


#include "apue.h" 
#include <errno.h> /* for definition of errno */ 
#include <stdarg.h> /* ISO C variable aruments */ 


static void err doit(int, int, const char *, va list); 


/* 
* Nonfatal error related to a system call. 


* 


x 


Print a message and return. 


void 


err ret(const char *fmt, ...) 


( 


/* 
* 


* 


xy 


va list ap; 


va start(ap, fmt); 
err doit(1, errno, fmt, ap); 
va end(ap); 


Fatal error related to a system call. 
Print a message and terminate. 


void 


err sys(const char *fmt, ...) 


{ 


xy 


va_list ap; 


va_start (ap, fmt); 
err_doit(1, errno, fmt, ap); 
va end(ap); 

exit (1); 


Nonfatal error unrelated to a system call. 
Error code passed as explict parameter. 
Print a message and return. 


void 


err cont(int error, const char *fmt, ...) 


( 


id 


va list ap; 


va start(ap, fmt); 
err doit(1, error, fmt, ap); 
va end(ap); 


Fatal error unrelated to a system call. 
Error code passed as explict parameter. 
Print a message and terminate. 


void 
err exit(int error, const char *fmt, ...) 


( 


va list ap; 


va start(ap, fmt); 
err doit(1l, error, fmt, ap); 
va end(ap); 


exit(1); 


/* 
* Fatal error related to a system call. 
* Print a message, dump core, and terminate. 
wy 
void 
err_dump (const char *fmt, ...) 
{ 
va_list ap; 


va_start(ap, fmt); 

err doit(1, errno, fmt, ap); 

va_end (ap); 

abort (); /* dump core and terminate */ 
exit(1); /* shouldn't get here */ 


/* 
* Nonfatal error unrelated to a system call. 
* Print a message and return. 
wy 

void 

err_msg (const char *fmt, ...) 

{ 

va_list ap; 


va start(ap, fmt); 
err doit(0, 0, fmt, ap); 
va end(ap); 


/* 

* Fatal error unrelated to a system call. 
* Print a message and terminate. 

m/f 

void 

err_quit(const char *fmt, ...) 

{ 


va_list ap; 


va_start(ap, fmt); 

err doit(0, 0, fmt, ap); 
va end(ap); 

exit(1); 


/* 

* Print a message and return to caller. 

* Caller specifies "errnoflag". 

ek 

static void 

err doit (int errnoflag, int error, const char *fmt, 


{ 


va_list ap) 


char buf [MAXLINE]; 


vsnprintf(buf, MAXLINE-1, fmt, ap); 
if (errnoflag) 
snprintf (buft+strlen(buf), MAXLINE-strlen(buf)-1, ": $e", 
strerror(error)); 
etregtíibuf, "Xa" s 


fflush(stdout); /* in case stdout and stderr are the same */ 
fputs(buf, stderr); 
fflush (NULL); /* flushes all stdio output streams */ 


图 B-3 输出 至 标准 错误 的 出 错 函 数 

图 B-4 包 括 了 各 log XXX 出 错 函 数 。 大 进程 不 以 守护 进程 方式 运 
行 ， 那 么 调用 者 应 当 定义 变量 log to_stderr， 并 将 其 设置 为 非 0 值 。 在 这 
种 情况 下 ， 出 错 消息 被 发 送 至 标准 错误 。 若 log_to_stderr 标 志 为 0， 则 使 
用 syslog 设 施 (113.477) ° 


/* 
* Error routines for programs that can run as a daemon. 
*/ 


#include "apue.h" 

#include <errno.h> /* for definition of errno */ 
#include <stdarg.h> /* ISO C variable arguments */ 
#include <syslog.h> 


static void log_doit(int, int, int, const char *, va_list ap); 


/* 

* Caller must define and set this: nonzero if 
* interactive, zero if daemon 

*y 


extern int log to stderr; 


/* 
* Initialize syslog(), if running as daemon. 
in 
void 
log open(const char *ident, int option, int facility) 
( 

if (log to stderr -- 0) 

openlog(ident, option, facility); 


/* 

* Nonfatal error related to a system call. 

* Print a message with the system's errno value and return. 
sey 

void 

log ret(const char *fmt, ...) 

{ 


va_list ap; 


va_start(ap, fmt); 


log doit(1, errno, LOG ERR, fmt, ap); 
va end(ap); 


/* 
* Fatal error related to a system call. 
* Print a message and terminate. 

*/ 

void 

log sys(const char *fmt, ...) 

{ 


va_list ap; 


va_start(ap, fmt); 

log doit(1, errno, LOG ERR, fmt, ap); 
va end(ap); 

exit(2); 


/* 
* Nonfatal error unrelated to a system call. 
* Print a message and return. 
E 
void 
log msg(const char *fmt, ...) 
{ 
va_list ap; 


va_start(ap, fmt); 
log_doit(0, 0, LOG_ERR, fmt, ap); 
va_end (ap); 


/* 

* Fatal error unrelated to a system call. 
* Print a message and terminate. 

iid 

void 

log quit(const char *fmt, ...) 

( 


va list ap; 


va start(ap, fmt); 

log doit(0, 0, LOG ERR, fmt, ap); 
va end(ap); 

exit (2); 


/* 

* Fatal error related to a system call. 

* Error number passed as an explicit parameter. 
* Print a message and terminate. 

si 

void 

log_exit(int error, const char *fmt, ...) 


va list ap; 


va start(ap, fmt); 

log doit(1, error, LOG ERR, fmt, ap); 
va end (ap); 

exit (2); 


/* 

* Print a message and return to caller. 

* Caller specifies "errnoflag" and "priority". 

Ny 

Static void 

log doit(int errnoflag, int error, int priority, const char *fmt, 
va list ap) 


char buf [MAXLINE] ; 


vsnprintf (buf, MAXLINE-1, fmt, ap); 
if (errnoflag) 
snprintf (buf+strlen (buf), MAXLINE-strlen(buf)-1, ": %s", 
strerror(error) ); 
strceat (buf, "\n"); 
if (log_to_stderr) { 
fflush (stdout); 
fputs (buf, stderr); 
fflush(stderr); 
) else ( 
syslog(priority, "$s", buf); 
} 


图 B-4 用 于 守护 进程 的 出 错 函 数 


us 


第 1 
1.1 这 个 习题 利用 1sG) 命 令 的 下 面 两 个 参数 : -i 打印 文件 或 目录 的 i 
节点 编号 (4.14 广 详细 讨论 了 i 节点 ) ; -d 仅 打印 目录 信息 ， 而 不 是 打印 
目 孙 中 所 有 文件 的 信息 。 
执行 下 列 命令 : 
$ Is -ldi /etc/. /etc/.. -i 要 求 打印 i 市 点 编号 
162561 drwxr-xr-x 66 root 4096 Feb 5 03:59 /etc/./ 
2 drwxr-xr-x 19 root 4096 Jan 15 07:25 /etc/../ 

$ Is -ldi /. /.. .和 .. 的 FF 点 编号 均 为 2 
2 drwxr-xr-x 19 root 4096 Jan 15 07:25 /./ 
2 drwxr-xr-x 19 root 4096 Jan 15 07:25 /../ 

1.2 UNIX 系 统 是 多 道 程序 或 多 任务 系统 ， 所 以 ， 在 图 1-6 所 示 程 序 
运行 的 同时 其 他 两 个 进程 也 在 运行 。 

1.3 因为 perror 的 msg 参 数 是 一 个 指针 ，perror 束 可 以 改变 msg 指 同 的 
字符 串 。 然 而 使 用 限定 符 const 限 制 了 perror 不 能 修改 msg 指 针 指 回 的 字 
从 串 。 而 对 于 strerror， 其 错误 号 参数 是 整数 类 型 ， 并 且 C 是 按 值 传递 所 
有 参数 ， 因 此 即使 strerror 函 数 想 修改 参数 的 值 也 修改 不 了 ， 也 隐没 有 
必要 使 用 const 属 性 。 QUART CHHABRA OE Ae Rae, WS I 
Kernighan #llRitchie[1988]HJ5.271) » ) 

1.4 在 2038 年 。 将 time_t 数 据 类 型 定 为 64 位 整 型 ， 束 可 以 解决 该 问 
题 了 。 如 果 它 现在 是 32 位 整 型 ， 那 么 为 使 应 用 程序 正常 工作 ， 应 当 对 


其 重 编译 。 但 是 这 一 问题 还 有 更 精 糕 之 处 。 

某 些 文 件 系统 及 备份 介质 以 32 位 整 型 存放 时 间 。 对 于 这 些 同样 需 
要 加 以 更 新 ， 但 又 需要 能 读 旧 的 格式 。 

1.5 大 约 248 天 。 

第 2 章 

2.1 下 面 是 FreeBSD 中 使 用 的 技术 。 在 头 文件 <machine/_types.h> 中 
定义 可 在 多 个 头 文 件 中 出 现 的 基本 数据 类 型 。 例 如 : 


typedef int . int32 t; 


typedef unsigned int —uint32 t; 
#ifndef MACHINE TYPES H. 
#define MACHINE TYPESH. 


typedef — uint32 t . size_t; 


#endif /* MACHINE TYPESH */ 

在 每 个 可 以 定义 基本 数据 类 型 size_t 的 头 文件 中 ， 包 售 下 面 的 语句 
序列 。 

#ifndef SIZE T DECLARED 

typedef size t size t; 

#define SIZE T DECLARED 

#endif 

这 样 ， 实 际 上 只 执行 一 次 size _t 的 typedef 。 

2.3 Wl R OPEN_MAX 是 未 确定 的 或 大 得 出 奇 ( 即 等 于 
LONG MAX) ， 和 那么 可 以 使 用 getrlimit 得 到 每 个 进程 的 最 大 打开 文件 
摘 述 符 数 。 因 为 可 以 修改 对 每 个 进程 的 限制 ， 所 以 我 们 不 能 将 前 一 个 
调用 得 到 的 值 高 速 缓存 起 来 〈 它 可 能 已 被 更 改 ) ， 见 图 C-1。 


#include "apue.h" 
#include <limits.h> 
#include <sys/resource.h> 


#define OPEN_MAX GUESS 256 


long 
open_max (void) 
{ 
long openmax; 


struct rlimit rl; 


if ((openmax = sysconf( SC OPEN MAX)) < 0 || 
openmax == LONG MAX) { 
if (getrlimit(RLIMIT NOFILE, &rl) « 0) 
err sys("can't get file limit"); 


if (rl.rlim max == RLIM INFINITY) 
openmax - OPEN MAX GUESS; 
else 
openmax = rl.rlim max; 


) 


return (openmax) ; 


图 C-1 标识 最 大 可 能 文件 描述 符 的 替换 方法 


第 3 章 

3.1 所 有 磁盘 LO 都 要 经 过 内 核 的 块 缓存 区 (也 称 为 内 核 的 缓冲 区 高 
ERT) 。 唯 一 例外 的 是 对 原始 磁盘 设备 的 WO， 但 是 我 们 不 考虑 这 种 
情况 《Bach[1986] 的 第 3 章 讲述 了 这 种 缓存 区 高 速 缓存 的 操作 ) 。 既 然 
read 或 write 的 数据 都 要 被 内 核 缓冲 ， 那 么 术语 “不 带 缓 冲 的 IO” 指 的 是 
在 用 户 的 进程 中 对 这 两 个 范 数 不 会 自动 绥 冲 ， 每 次 read 或 write 束 要 进行 
一 次 系统 调用 。 

3.3 每 次 调用 open 范 数 就 分 配 一 个 新 的 文件 表 项 。 但 是 因为 两 次 打 
开 的 是 同一 个 文件 ， 则 两 个 文件 表 项 指向 相同 的 v 节 点 。 调 用 dup 引 用 
已 存在 的 文件 表 项 (此 处 指 fd1l 的 文件 表 项 ) ， 见 图 C-2。 当 F_SETFD 
作用 于 fd1 时 ， 只 影响 fd1 的 文件 描述 符 标 志 ; F_SETFL 作 用 于 fd1 时 ， 
则 影响 fd1l 及 fd2 指 辣 的 文件 表 项 。 


进程 表 项 文件 表 


| “文件 状态 标志 | 
| “当前 文件 偏 移 量 | 
‘a | viam 一 = 
标志 文件 指针 v 节 点 信息 
f MEE € "aad 
fd3: a 
| “文件 状态 标志 i 节点 信息 
| 当前 文件 偏 移 量 | “当前 文件 长 度 
[ via | i_vnode 


AIC-2 open 和 dup 的 结果 


3.4 如 果 fd 是 1， 执 行 dup2(fd, D) 后 返回 1， 但 没有 关闭 文件 描述 符 1 
( 见 3.12 节 ) 。 调 用 3 次 dup2 后 ，3 个 描述 符 指向 相同 的 文件 表 项 ， 所 以 

不 需要 关闭 描述 符 。 

如 末 fd 为 3， 调 用 3 次 dup2 后 ， 有 4 个 搬 述 符 指 向 相同 的 文件 表 项 ， 
这 种 情况 下 就 需要 关闭 描述 符 3。 

3.5 因为 shell 从 左 到 右 处 理 命令 行 ， 所 以 

/a.out > outfile 2>&1 首 先 设置 标准 输出 到 outfile， 然 后 执行 dup 将 标 
准 输 出 复制 到 描述 符 2 (标准 错误 ) 上 ， 其 结果 是 将 标准 输出 和 标准 错 
误 设 置 为 同一 个 的 文件 ， 即 描述 符 1 和 2 指向 同一 个 文件 表 项 。 而 对 
于 命令 行 

/a.out 2>&1 > outfile 

由 于 首先 执行 dup， 所 以 描述 符 2 成 为 终端 (假设 命令 是 交互 执行 
的 ) ， 标 准 输出 重 定向 到 outfile。 结 果 是 描述 符 1 指 向 outfile 的 文件 表 
项 ， 描 述 符 2 指 回 终 端的 文件 表 项 。 

3.6 这 种 情况 下 ， 仍 然 可 以 用 lseek 和 read 函 数 读 文件 中 任意 一 个 位 
置 的 内 容 。 但 是 write 函数 在 写 数据 之 前 会 目 动 将 文件 侦 移 量 设 置 为 文 
件 尾 ， 所 以 写 文件 时 只 能 从 文件 尾 端 开 始 。 


第 4 音 


第 4 章 


4.1 stat 函 数 总 是 跟随 符号 链接 〈 见 图 4-17) ， 所 以 该 程序 决 不 会 显 
未 文件 类 型 是 “和 从 号 链接 ”。 
例如 ， 正 如 本 书 正 文中 所 示 ，/dev/cdrom 是 /dev/sr0 的 一 个 从 号 链 
接 ， 但 是 stat 函 数 的 结果 只 显示 /dewcdrom 是 一 个 块 特殊 文件 ， 而 不 报 
告 它 是 一 个 符号 链接 。 寿 符号 链接 指 回 一 个 不 存在 的 文件 ，stat 会 出 错 
[n] o 
42 将 关闭 该 文件 的 所 有 访问 权限 。 
$umask 777 


$ date > temp.foo 


Pu 


$ Is -1 temp.foo 


二 1 sar 29 Feb 5 14:06 temp.foo 

4.3 下 面 的 命令 显示 了 关闭 用 户 读 权 限时 所 发 生 的 情况 。 
$ data > foo 

$chmodu-rfoo 关闭 用 户 读 权限 

$ Is -l foo 验证 文件 的 权限 

--W-I--I-- 1 sar 29 Feb 5 14:21 foo 

$ cat foo 读 文件 


cat: foo: Permission denied 
4.4 如 果 用 open 或 creat 创 建 已 经 存在 的 文件 ， 则 该 文件 的 访问 权限 
位 不 变 。 运 行 图 4-9 中 的 程序 可 以 验证 这 点 。 


$ rm foo bar 删除 文件 

$ data > foo 创建 文件 

$ data > bar 

$ chmod a-r foo bar ”关闭 所 有 的 读 权 限 
$ Is -l foo bar 验证 其 权限 
--W------- 1 sar 29 Feb 514:25 bar 


--W------- 1 sar 29 Feb 5 14:25 foo 


$ /a.out 运行 图 4-9 程 序 

$ Is -l foo bar 检查 文件 的 权限 和 大 小 

--W------- 1 sar 0 Feb 5 14:26 bar 

--W------- 1 sar 0 Feb 5 14:26 foo 

可 以 看 出 访问 权限 没有 改变 ， 但 是 文件 被 截断 了 。 

4.5 目录 的 长 度 从 来 不 会 是 9， 因为 它 总 是 包含 .和 .. 两 项 。 符 号 链接 
的 长 度 指 其 路 径 名 包含 的 字符 数 ， 由 于 路 径 名 中 至 少 有 一 个 字符 ， 所 
以 长 度 也 不 为 0。 

4.7 当 创建 新 的 core 文件 时 ， 内 核对 其 访问 权限 有 一 个 默认 设置 ， 
在 本 例 中 是 rw-r--r--。 这 一 默认 值 可 能 会 也 可 能 不 会 补 umask 的 值 修 
改 。shell 对 创建 的 重 定向 的 新 文件 也 有 一 个 默认 的 访问 权限 ， 本 例 中 
为 rw-rw-rw-， 这 个 值 总 是 被 当前 的 umask 修 改 ， 在 本 例 中 umask 为 02。 

4.8 不 能 使 用 du 的 原因 是 它 需 要 文件 名 ， 如 

du tempfile 

或 目 隶 名， 如 

du . 

只 有 当 unlink 函数 返回 时 才 释 放 tempfile 的 目录 项 ，du .命令 没有 
计算 仍然 被 tempfile 占 用 的 空间 。 本 例 中 只 能 使 用 df 命令 查看 文件 系统 
中 实际 可 用 的 空 几 空间 。 

4.9 如 果 被 删除 的 链接 不 是 该 文件 的 最 后 一 个 链接 ， 则 不 会 删除 该 
文件 。 此 时 ， 文 件 的 状态 更 改 时 间 被 更 新 。 但 是 ， 如 果 被 删除 的 链接 
是 最 后 一 个 链接 ， 则 该 文件 将 被 物理 删除 。 这 时 再 去 更 新 文件 的 状态 
更 改 时 间 就 没有 意义 ， 因 为 包含 文件 所 有 信息 的 i 节点 将 会 随 着 文件 的 
删除 而 被 释放 。 

4.10 用 opendir 打 开 一 个 目录 后 ， 递 归 调 用 函数 dopath。 假 设 opendir 
使 用 一 个 文件 描述 符 ， 并 且 只 有 在 处 理 完 目 永 后 才 调 用 closedir 释 放 擂 
述 符 ， 这 惑 意味 着 每 次 降 一 级 就 要 使 用 另外 一 个 描述 符 。 所 以 进程 可 


打开 的 最 大 描述 符 数 就 限制 了 我 们 可 以 遍历 的 文件 系统 树 的 深度 。 
Single UNIX Specification 的 XSI 扩 展 中 说 明 的 ftw 人 允许 调用 者 指定 使 用 的 
描述 符 数 ， 这 隐 舍 着 可 以 关闭 描述 符 并 且 重 用 它们 。 

4.12 chroot 函数 被 因特网 文件 传输 协议 (Internet File Transfer 
Protocol, FTP) 程序 用 于 辅助 安全 性 。 系 统 中 没有 账户 的 用 户 (也 称 
为 匿名 FTP) 放 在 一 个 单独 的 目录 下 ， 利 用 chroot 将 此 目录 当 作 新 的 根 
目录 ， 就 可 以 阻止 用 户 访问 此 目录 以 外 的 文件 。 

chroot 也 用 于 在 另 一 台 机 器 上 构造 一 个 文件 系统 层次 结构 的 副本 ， 
然后 修改 此 副本 ， 不 会 更 改 原 来 的 文件 系统 。 这 可 用 于 测试 新 软件 包 
的 安装 。 

chroot 只 能 由 超级 用 户 执 行 ， 一 旦 更 改 了 一 个 进程 的 根 ， 该 进程 及 
其 后 代 进 程 就 再 也 不 能 恢复 至 原先 的 根 。 

4.13 首先 调用 stat 函数 取得 文件 的 3 个 时 间 值 ， 然 后 调用 utimes 
设置 期 望 的 值 。 在 调用 utimes 时 我 们 不 希望 改变 的 值 应 当 是 stat 中 相应 
的 值 。 

4.14 finger(1) 对 邮箱 调用 stat 画 数 ， 最 近 一 次 的 修改 时 间 是 上 一 次 
接收 邮件 的 时 间 ， 最 近 访 问 时 间 是 上 一 次 读 邮 件 的 时 间 。 

4.15 cpio 和 tar 存 储 的 只 是 归档 文件 的 修改 时 间 (st_mtim) 。 因 为 
文件 归档 时 一 定 会 读 它 ， 所 以 该 文件 的 访问 时 间 对 应 于 创建 归档 文件 
的 时 间 ， 因 此 没有 存储 其 访问 时 间 。cpio 的 -a 选 项 可 以 在 读 输入 文件 后 
重新 设置 该 文件 的 访问 时 间 ， 于 是 创建 归档 文件 不 改变 文件 的 访问 时 
Ho (但 是 ， 重 置 文件 的 访问 时 间 确 实 改变 了 状态 更 改 时 间 。) 状态 
更 改 时 间 没 有 存储 在 文 挡 上 ， 因 为 即使 它 曾 被 归档 ， 在 抽取 时 也 不 能 
设置 其 值 。 (utimes 函数 极其 相关 的 futimens 和 utimensta 函 数 可 以 更 改 
的 仅仅 是 访问 时 间 和 修改 时 间 。) 

对 tar 来 说 ， 在 抽取 文件 时 ， 其 默认 方式 是 复原 归档 时 的 修改 时 间 
值 ， 但 是 tar 的 -m 选 项 则 将 修改 时 间 设置 为 抽取 文件 时 的 时 间 ， 而 不 是 


复原 归档 时 的 修改 时 间 值 。 对 于 tar， 无 论 何 种 情况 ， 在 抽取 后 ， 文 件 
的 访问 时 间 均 是 抽取 文件 时 的 时 间 。 

男 一 方面 ，cpio 将 访问 时 间 和 修改 时 间 设 置 为 抽取 文件 时 的 时 间 。 
默认 情况 下 ， 它 并 不 试图 将 修改 时 间 设 置 为 归档 时 的 值 。cpio 的 -m 选 
项 将 文件 的 修改 时 间 和 访问 时 间 设 置 为 归档 时 的 值 。 

4.16 内 核对 目录 树 的 深度 没有 内 在 的 限制 ， 但 是 如 果 路 径 名 的 长 
度 超出 了 PATH_MAX， 则 有 许多 命令 会 失败 。 图 C-3 程 序 创 建 了 一 个 深 
度 为 1 000 的 目录 树 ， 每 一 级 目录 名 有 45 个 字符 。 

在 所 有 平台 上 我 们 都 能 构建 这 样 的 结构 ， 但 并 不 是 在 所 有 平台 上 
都 能 用 getcwd 得 到 第 1 000 级 目录 的 绝对 路 径 名 。 在 Mac OS X 10.6.8 
中 ， 当 到 达 长 路 径 的 目录 尾部 时 ，getcwd 就 不 再 成 功 了 。 在 FreeBSD 
8.0、Linux 3.2.0 和 Solaris 10 中 ，getcwd 可 以 获得 路 径 名 ， 但 是 需要 多 次 
调用 realloc 得 到 一 个 足够 大 的 缓冲 区 。 在 Linux 3.2.0 上 运行 该 程序 后 得 
到 : 


$ ./a.out 


getcwd failed, size = 4096: Numerical result out of range 
getcwd failed, size = 4196: Numerical result out of range 
省 略 了 418 行 
getcwd failed, size = 45896: Numerical result out of range 
getcwd failed, size = 45996: Numerical result out of range 
length = 46004 
显示 46004 字 万 的 路 径 名 
然而 ， 不 能 用 cpio 归 档 此 日 录 ， 因 为 文件 名 太 长 了 。 事 实 上 ，cpio 
在 所 有 4 种 平台 上 都 不 能 归档 此 目 孙 。 于 此 对 比 的 是 ， 在 FreeBSD 8.0 ` 
Linux 3.2.0 和 Mac OS X 10.6.8 上 ， 可 以 用 tar 归 档 此 目录 。 然 而 ， 在 
Linux 3.2.0 上 ， 我 们 不 能 从 归档 文件 中 抽取 出 目录 的 层次 结构 。 


#include "apue.h" 
#include «fcntl.h» 


#define DEPTH 1000 /* directory depth */ 

#define STARTDIR "/tmp" 

#define NAME "alonglonglonglonglonglonglonglonglonglongname" 
#define MAXSZ (10*8192) 

int 


main (void) 


{ 


int ls 
size t size; 
char *path; 


if (chdir(STARTDIR) « 0) 
err sys("chdir error"); 


for (i = 0; i < DEPTH; i++) { 
if (mkdir(NAME, DIR MODE) « 0) 
err sys("mkdir failed, i = $d", i); 
if (chdir(NAME) « 0) 
err sys("chdir failed, i = $d", i); 


if (creat("afile", FILE MODE) « 0) 
err sys("creat error"); 


/* 


* The deep directory is created, with a file at the leaf. 


* Now let's try to obtain its pathname. 
xm 

path = path alloc(é&size); 

fos ( x Mu 


if (getcwd(path, size) != NULL) { 
break; 
) else { 


err ret ("getcwd failed, size = %ld", (long) size); 


size += 100; 

if (size > MAXSZ) 
err_quit ("giving up"); 

if ((path = realloc(path, size)) == NULL) 
err_sys("realloc error"); 


} 
printf ("length = %ld\n%s\n", (long)strlen(path), path); 


exit (0); 


图 C-3 创建 深 日 录 树 


4.17 /dev 目 录 关 闭 了 一 般 用 户 的 写 访 问 权 限 ， 以 防止 普通 用 户 删 除 
目录 中 的 文件 名 。 这 就 意味 着 unlink 失 败 。 
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5.2 fgets 函 数 读 入 数据 ， 直 到 行 结束 或 缓冲 区 满 (当然 会 留 出 一 个 
字 节 存放 终止 null 字 节 ) 。 

同样 ，fputs 只 负责 将 绥 神 区 的 内 容 输出 直到 遇 到 一 个 nul 宇 节 ， 而 
并 不 考虑 缓 神 区 中 是 否 包 含 换行 符 。 所 以 ， 如 果 将 MAXLINE 设 得 很 
小 ， 这 两 个 函数 仍然 会 正 第 工作 ; ARTES BCAIN, ER BTA 
行 的 次 数 要 多 于 MAXLINE 值 设置 得 较 大 的 时 候 。 

如 果 这 些 函 数 删 除 或 添加 换行 符 “如 gets 和 puts 函 数 的 操作 ) ， 则 
必需 保证 对 于 最 长 的 行 ， 缓 冲 区 也 足够 大 。 

5.3 当 printf 没 有 输出 任何 字符 时 ， 如 printf(");， 画 数 调用 返回 0。 

5.4 这 是 一 个 比较 第 见 的 错误 。getc 以 及 getchar 的 返回 值 是 int 类 
型 ， 而 不 是 char 类 型 。 

由 于 EOF 经 和 营 定义 为 -1， 那 么 如 有 果 系 统 使 用 的 是 有 符号 的 字符 类 
型 ， 程 序 还 可 以 正常 工作 。 但 如 果 使 用 的 是 无 符号 字符 类 型 ， 那 么 返 
回 的 EOF 被 保存 到 字符 c 后 将 不 再 是 -1， 所 以 ， 程 序 会 进入 死 循环 。 本 
书 说 明 的 4 种 平台 都 使 用 市 符号 字符 ， 所 以 实例 代码 都 能 工作 。 

5.5 使 用 方法 为 ， 先 调用 fflush 后 调用 fsync。fsync 所 使 用 的 参数 由 
fileno 函 数 获 得 。 

如 采 不 调用 fflush， 所 有 的 数据 仍然 在 内 存 缓冲 区 中 ， 此 时 调用 
fsync 将 没有 任何 效果 。 

5.6 当 程序 交互 运行 时 ， 标 准 输 入 和 标准 输出 均 为 行 缓冲 方式 。 
次 调用 fgets 时 标准 输出 设备 将 目 动 冲洗 。 

5.7 基于 BSD 系 统 的 fmemopen 的 实现 如 图 C-4 所 示 。 


#include 
#include 
#include 
#include 


/* 


<stdio.h> 
<stdlib.h> 
<string.h> 
<errno.h> 


* Our internal structure tracking a memory stream 


xj 


struct memstream 


{ 
char 
size 
size 
size 
int 
H 


/* flags 
#define 
#define 
#define 
#define 
#define 


#ifndef 
#define 
#endif 


static int mstream_read(void *, 


*buf; 
E rsize; 
E vsize; 
LH curpos; 

flags; 


Ly 
MS READ 
MS WRITE 
MS APPEND 
MS TRUNCATE 
MS MYBUF 


MIN 


MIN(a, b) ((a) < 


/* in-memory buffer */ 

/* real size of buffer */ 

/* virtual size of buffer */ 

/* current position in buffer */ 
/* see below */ 


0x01 
0x02 
0x04 
0x08 
0x10 


(b) 


/* 
/* 
/* 
/* 
/* 


open for reading */ 

open for writing */ 

append to stream */ 

truncate the stream on open */ 
free buffer on close */ 


(a) : (b)) 


char *, int); 


static int mstream write(void *, 


const char *, int); 


Static fpos t mstream seek(void *, fpos t, int); 


static int mstream close(void *); 
static int type to flags(const char * restrict type); 
static off t find end(char *buf, 


FILE * 


fmemopen(void * restrict buf, 


size t len); 


size t size, 


const char * restrict type) 


struct memstream *ms; 
FILE *fp; 


if (size == 0) { 
errno = EINVAL; 
return (NULL) ; 
} 
if ((ms = malloc(sizeof(struct memstream))) == NULL) { 
errno = ENOMEM; 
return (NULL) ; 
} 


if ((ms->flags = type to flags(type)) == 0) { 
errno = EINVAL; 
free (ms); 


return (NULL); 
} 
if (buf == NULL) { 
if ((ms->flags & (MS READ|MS WRITE)) != 
(MS READ|MS WRITE)) ( 
errno - EINVAL; 
free (ms); 
return (NULL); 
} 
if ((ms->buf = malloc(size)) == NULL) { 
errno = ENOMEM; 
free (ms); 
return (NULL); 
} 
ms-»rsize = size; 
ms->flags |= MS MYBUF; 
ms-»curpos = 0; 
} else { 
ms->buf = buf; 
ms-»rsize = size; 
if (ms->flags & MS_APPEND) 
ms-»curpos = find_end(ms->buf, ms-»rsize); 
else 
ms-»curpos = 0; 
} 
if (ms->flags & MS_APPEND) { /* "a" mode */ 
ms-»vsize - ms-»curpos; 
) else if (ms->flags & MS TRUNCATE) { /* "w" mode */ 
ms-»vsize - 0; 
) else ( /* "r" mode */ 
ms-»vsize - size; 
} 
fp = funopen(ms, mstream_read, mstream_write, 
mstream seek, mstream close); 
if (fp == NULL) { 
if (ms->flags & MS MYBUF) 
free (ms-»buf); 
free (ms); 
} 
return (fp); 


static aint 
type to flags(const char * restrict type) 


{ 


const char *cp; 
int flags = 0; 


for (cp = type; *cp != 0; cptt) { 
switch (*cp) { 


case 'r': 
if (flags != 0) 
return (0); /* error */ 
flags |= MS READ; 
break; 
case 'w': 
if (flags != 0) 
return(0); /* error */ 
flags |= MS WRITE|MS TRUNCATE; 
break; 
case 'a': 
if (flags != 0) 
return(0); /* error */ 
flags |= MS APPEND; 
break; 
case "+" 
if (flags == 0) 
return(0); /* error */ 
flags |= MS READ|MS WRITE; 
break; 
case "bis 
if (flags == 0) 
return(0); /* error */ 
break; 
default: 
return(0); f* error */ 


} 


return (flags); 


static off t 
find end(char *buf, size t len) 


{ 


off t off = 0} 


while (off « len) ( 
if (buf[off] == 0) 
break; 
offtt; 


} 
return (off); 


static int 
mstream_read(void *cookie, char *buf, int len) 
{ 

int nz; 

struct memstream *ms = cookie; 


if (!(ms->flags & MS READ)) { 
errno = EBADF; 
return (-1); 

} 

if (ms->curpos >= ms->vsize) 
return (0); 


/* can only read from curpos to vsize */ 
nr = MIN(len, ms->vsize - ms-»curpos); 
memcpy (buf, ms->buf + ms-»curpos, nr); 
ms->curpos += nr; 

return (nr); 


static int 
mstream write(void *cookie, const char *buf, int len) 
( 

int nw, off; 

struct memstream *ms = cookie; 


if (!(ms->flags & (MS APPEND|MS WRITE))) { 
errno = EBADF; 
return (-1); 
} 
if (ms->flags & MS APPEND) 
off - ms-»vsize; 
else 
off = ms-»curpos; 
nw = MIN(len, ms->rsize - off); 
memcpy (ms->buf + off, buf, nw); 
ms-»curpos = off + nw; 
if (ms->curpos > ms-»vsize) { 
ms->vsize = ms->curpos; 
if (((ms->flags & (MS READ|MS WRITE)) == 
(MS READ|MS WRITE)) && (ms-»vsize < ms-»rsize)) 
*(ms->buf + ms->vsize) = 0; 
} 
if ((ms->flags & (MS WRITE|MS APPEND)) && 
!(ms-»flags & MS READ)) { 
if (ms-»curpos < ms-»rsize) 
*(ms-»buf + ms->curpos) = 0; 
else 
*(ms->buf + ms->rsize - 1) = 0; 
} 


return (nw) ; 


) 


static fpos t 
mstream seek(void *cookie, fpos t pos, int whence) 
{ 

int off: 

struct memstream *ms - cookie; 


switch (whence) { 

case SEEK_SET: 
off = pos; 
break; 

case SEEK_END: 
off = ms->vsize + pos; 
break; 

case SEEK CUR: 
off = ms->curpos + pos; 
break; 

} 

if (off < 0 || off > ms->vsize) { 
errno = EINVAL; 
return -1; 

} 

ms-»curpos = off; 

return (off); 


} 


static int 
mstream close(void *cookie) 
{ 


struct memstream *ms = cookie; 


if (ms->flags & MS MYBUF) 
free (ms->buf) ; 

free (ms); 

return(0); 


图 C-4 BSD 系 统 的 fmemopen 实 现 
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6.1 6.3 P Vli T f£ Linux fll Solaris A Zi F 3 [RI BH $$ OS Cr B5 ER 
BN o ANBE AE He.2 1 Pri ERG [8] HJ pw_passwd =F Ex [B SNe 1 3H EC 
较 ， 因 为 此 字段 不 是 加 密 的 口令 。 正 确 的 方法 是 使 用 阴影 口令 文件 中 
对 应 用 户 的 加 密 口 令 字段 来 进行 比较 。 

在 FreeBSD 和 Mac OS X 中 ， 口 令 文件 的 阴影 是 自动 建立 的 。 
FreeBSD 8.0 中 ， 仅 当 调 用 者 的 有 效用 户 ID 为 0 时 ，getpwnam 或 getpwuid 


函数 返回 的 passed 结 构 中 的 pw_passwd 字 段 包 含有 加 密 口 令 。 在 Mac OS 
X 10.6.8 上 ， 加 蜜 口令 不 能 通过 这 些 接口 访问 。 

6.2 在 Linux 3.2.0 和 Solaris 10 中 ， 图 C-5 程 序 输出 加 密 口 令 。 当 然 ， 
除非 有 超级 用 户 权限 ， 否 则 调用 getspnam 将 返回 EACCES 错 误 。 


#include "apue.h" 
#include <shadow.h> 


int 
main (void) /* Linux/Solaris version */ 
{ 

struct spwd  *ptr; 


if ((ptr = getspnam("sar")) == NULL) 
err sys("getspnam error"); 
printf("sp pwdp = %s\n", ptr->sp_pwdp == NULL || 
ptr-»sp pwdp[0] == 0 ? "(null)" : ptr->sp_pwdp) ; 
exit(0); 


图 C-5 在 Linux 和 Solaris 系 统 中 输出 加 密 口 令 

在 FreeBSD 8.0 中 ， 具 有 超级 用 户 权 限时 ， 图 C-6 程 序 将 输出 加 密 口 
令 ， 否 则 pw_passed 的 返回 值 为 星 号 (*) 。 在 Mac OS X 106.87, ^ 
管 其 运行 时 的 用 户 权限 是 什么 都 输出 星 号 。 


#include "apue.h" 
#include <pwd.h> 


int 
main (void) /* FreeBSD/Mac OS X version */ 
{ 
struct passwd "ptr 
if ((ptr = getpwnam("sar")) == NULL) 
err sys("getpwnam error"); 
printf("pw passwd = %s\n", ptr->pw_passwd == NULL || 
ptr-»pw passwd[0] == 0 ? "(null)" : ptr->pw_passwd) ; 
exit (0); 


图 C-6 在 FreeBSD 和 Mac OS X 中 输出 加 密 口 令 


6.5 图 C-7 程 序 以 类 似 于 date 命 令 的 格式 输出 日 期 。 图 C-7 中 程序 的 
运行 结果 如 下 : 


finclude "apue.h" 
#include <time.h> 


int 

main (void) 

( 
time t caltime; 
struct tm *tm; 
char line[MAXLINE]; 


if ((caltime = time(NULL)) == -1) 
err sys("time error"); 

if ((tm = localtime(&caltime)) == NULL) 
err sys("localtime error"); 

if (strftime(line, MAXLINE, "$a $b $d $X $Z2 $YWMn", tm) == 0) 
err sys("strftime error"); 

fputs(line, stdout); 

exit (0); 


AIC-7 以 date(1) 的 格式 输出 日 斯 和 时 间 


$ /a.out 作者 的 默认 格式 是 美国 东部 
Wed Jul 25 22:58:32 EDT 2012 


$ TZ-US/Mountain ./a.out 美国 山地 时 间 
Wed Jul 25 20:58:32 MDT 2012 

$ TZ-Japan ./a.out HK 

Thu Jul 26 11:58:32 JST 2012 
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7.1 原因 在 于 printf 的 返回 值 (输出 的 字符 数 ) 变 成 了 main 函数 的 
返回 值 。 为 了 验证 这 一 结论 ， 改 变 打印 字符 串 的 长 度 ， 然 后 运行 程 
序 ， 碍 看 返回 值 是 否 与 狐 的 字符 串 长 度 值 匹配 。 

当然 ， 并 不 是 所 有 的 系统 都 会 出 现 该 情况 。 还 要 注意 的 是 ， 如 果 
在 gcc 中 允许 ISO C 扩 展 的 编译 选项 ， 返 回 值 将 总 是 0， 这 是 标准 要 来 
Hy) ° 


7.2 当 程序 处 于 交互 运行 方式 时 ， 标 准 输 出 通常 处 于 行 缓冲 方式 ， 
所 以 当 输 出 换行 行 时 ， 上 次 的 结果 才 被 真正 输出 。 如 果 标 准 输 出 被 定 
向 到 一 个 文件 ， 而 标准 输出 处 于 全 缓冲 方式 ， 则 当 标 准 VO 清 理 操作 执 
行 时 ， 结 果 才 真正 被 输出 。 

7.3 由 于 agrc 和 argv 的 副本 不 像 environ 一 样 保 存在 全 局 变量 中 ， 所 
以 在 大 多 数 UNIX 系 统 中 没有 其 他 办 法 。 

7.4 当 C 程 序 解 引 用 一 个 空 指针 出 错时 ， 执 行 该 程序 的 进程 将 
止 。 可 以 利用 这 种 方法 终止 进程 。 

7.5 RESCH P : 

typedef void Exitfunc(void); 


int atexit(Exitfunc *func); 

7.6 calloc 将 分 配 的 内 存 空间 初始 化 为 0。 但 是 ISO C 并 不 你 证 0 值 与 
浮 点 = 指针 的 值 相同 。 

7 只 有 通过 exec 函 数 执行 一 个 程序 时 ， 才 会 分 配 堆 和 栈 ( 见 8.10 

ms $ 

7.8 可 执行 文件 (aout) 包含 了 用 于 调试 core 文 件 的 符号 表 信 息 
FA strip(1) an a 时 ， 对 两 个 a.out 文 件 执行 这 条 命令 ， 它 
们 的 大 小 减 为 798 760 和 6 200 字 

7.9 没有 使 用 共享 库 时 ， ers 分 都 被 标准 VO 库 所 占 
用 o 

7.10 这 段 代 码 不 正确 。 因 为 在 目 动 变量 val 已 经 不 存在 之 后 ， 代 码 
还 通过 指针 引用 这 个 已 经 不 存在 的 目 动 变量 。 目 动 变 量 val 在 复合 语句 
开始 的 左 花 括号 之 后 声明 了 ， 但 当 该 复合 语句 结束 时 ， 即 在 匹配 的 右 
人 花 括 号 之 后 ， 目 动 变量 吏 不 存在 了 。 
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8.1 为 了 仿真 子 进程 终止 时 关闭 标准 输出 的 行为 ， 在 调用 exit 之 前 
加 下 列 代码 行 : 


fclose(stdout); 

为 了 观察 其 效果 ， 用 下 面 几 行 代替 程序 中 调用 printf 的 语句 。 

i = printf("pid = %ld, glob = 96d, var = %d\n", 

(long)getpid(), glob, var); 

sprintf(buf, "%d\n", i); 

write(STDOUT_FILENO, buf, strlen(buf)); 

还 需要 定义 变量 i 和 buf 。 

这 里 假设 子 进程 调用 exit 时 关闭 标准 MO 流 ， 但 不 关闭 文件 摘 述 符 
STDOUT_FILENO“。 有 些 版 本 的 标准 MO 库 会 关闭 与 标准 输出 相关 联 的 
文件 描述 符 从 而 引起 write 标准 输出 失败 。 在 这 种 情况 下 ， 调 用 dup 将 标 
准 输出 复制 到 另 一 个 描述 符 ，write 则 使 用 新 复制 的 文件 描述 符 。 

8.2 可 以 通过 图 C-8 程 序 来 说 明 这 个 问题 。 


finclude "apue.h" 


static void fl(void), f2(void); 


int 

main (void) 

{ 
f1(); 
£2(); 
_exit (0); 


} 


static void 


f1 (void) 
{ 
pid_t pid; 
if ((pid = vfork()) < 0) 


err sys("vfork error"); 
/* child and parent both return */ 
) 


static void 


£2 (void) 
( 
char buf£[1000]; /* automatic variables */ 
int $ 
for (i = 0; i < sizeof(buf); i++) 
buf[i] = 0; 


图 C-8 错误 使 用 vfork 的 例子 

当 函 数 f1 调 用 vfork 时 ， 父 进程 的 栈 指针 指向 人 函数 的 栈 帧 ， 见 图 C- 
9。vfork 使 得 子 进程 先 执行 然后 从 fl 返回， 接着 子 进程 调用 f2， 并 且 f2 
的 栈 帧 覆盖 了 f1 的 栈 帧 ， 在 人 2 中 子 进程 将 自动 变量 buf 的 值 置 为 0， 即 将 
栈 中 的 1 000 个 字 闻 的 值 都 置 为 0。 从 亿 返 回 后 子 进 程 调用 _exit， 这 时 栈 
中 main 栈 帧 以 下 的 内 容 已 经 被 亿 修 改 了 。 然 后 ， 父 进程 从 vfork 调 用 后 
恢复 继续 ， 并 从 fl 返回。 返回 信息 虽然 常常 保存 在 栈 中 ， 但 是 多 半 可 能 
已 经 被 子 进程 修改 了 。 对 于 这 个 例子 ， 父 进程 恢复 继续 执行 的 结果 要 
依赖 于 你 所 使 用 的 UNIX 系 统 的 实现 特征 〈 如 返回 信息 保存 在 栈 帧 中 的 
具体 位 置 、 修 改动 态 变量 时 履 盖 了 哪些 信息 等 ) 。 通 常 的 结果 是 一 个 
core 文 件 ， 但 在 你 的 系统 中 ， 产 生 的 结果 可 能 不 同 。 


8.4 Æ R8-13F, Fe FOES ERE I, (Ae SCE Re ag oe 
进程 要 输出 时 ， 要 让 父 进 程 终止 。 

是 父 进 程 先 终止 还 是 子 进程 先 执 行 输 出 ， 要 依赖 于 内 核对 两 个 进 
程 的 调度 〈 另 一 个 竞争 条 件 ) 。 在 父 进程 终止 后 ，shell 会 开始 执行 下 
一 个 程序 ， 它 也 许 会 干扰 子 进程 的 输出 。 为 了 避免 这 种 情况 ， 要 在 子 
进程 完成 输出 后 才 终止 父 进程 。 用 下 面 的 语句 替换 程序 中 fork 后 面 的 代 
fy o 

else if (pid == 0) { 

WAIT PARENTY(); /* parent goes first */ 
charatatime(" output from child Wn"); 
TELL_PARENT(getppid()); /* tell parent we're done */ 

} else { 

charatatime(" output from parent\n"); 

TELL_CHILD(pid); /* tell child we're done */ 

WAIT CHILDYQ); /* wait for child to finish */ 
j 


P EAT RD 


f1 
的 栈 帧 


栈 扩展 的 方向 | 


图 C-9 调用 vfork 时 的 栈 帧 


由 于 只 有 终止 父 进程 才能 开始 下 一 个 程序 ， 而 该 程序 让 子 进程 移 


运行 ， 所 以 不 会 出 现 上 面 的 情况 。 


8.5 对 argv[2] 打 印 的 是 相同 的 值 (/home/sar/bin/testinterp) ° JR 


是 execlp 在 结束 时 调用 了 execve， 并 且 与 直接 调用 execl 的 路 径 名 相同 。 
回忆 图 8-15 » 


8.6 图 C-10 程 序 创建 了 一 个 僵 死 进程 。 


#include "apue.h" 


#ifdef SOLARIS 


#define PSCMD "ps -a -o pid,ppid,s,tty,comm" 
#else 

#define PSCMD "ps -o pid,ppid, state, tty, command" 
#endif 


int 


main (void) 


{ 


pid t pid; 


if ((pid = fork()) « 0) 
err_sys("fork error"); 

else if (pid == 0) /* child. */ 
exit (0); 


/* parent */ 
sleep (4); 


system (PSCMD) ; 


exit (0); 


图 C-10 创建 一 个 僵 死 进程 并 用 ps 查看 其 状态 


执行 程序 结果 如 下 (ps(1) 用 Zz 表示 伪 死 进程 ) : 


$ ./a.out 

PID PPIDS TT COMMAND 
2369 2208 S pts/2 -bash 

7230 2369 S pts/2 /a.out 

7231 7230 Z pts/2 [a.out] <defunct> 


7232 7230S pts/2 sh -c ps -o pid,ppid,state,tty,command 


7233 7232 R pts/2 ps -o pid,ppid,state,tty,command 
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9.1 因 pute 登录 shell 的 父 进 程 ， 当 登录 shell 终 止 时 它 收 到 
SIGCHLD 信 号 量 ， 所 以 init 进 程 知道 什么 时 候 终端 用 户 注销 。 

网 络 登 录 没 有 包含 init， 在 utmp 和 wtmp 文 件 中 的 登录 项 和 相应 的 注 
销 项 是 由 一 个 处 理 登 录 并 检测 注销 的 进程 写 的 (本 例 中 为 telnetd) 。 
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10.1 当 程 序 第 一 次 接收 到 发 送 给 它 的 信号 时 就 终止 了 。 因 为 一 捕 
捉 到 信号 ，pause 函 数 就 返回 。10.2 栈 帧 见 图 C-11。 


处 理 处 理 longjmp 
SIGINT SIGALRM 后 
栈 的 底部 
main main main main 
的 栈 帧 的 栈 帧 的 栈 帧 的 栈 帧 
返回 
| main 
sleep2 sleep2 sleep2 
的 栈 帧 的 栈 帧 的 栈 帧 
sig int sig int 
的 栈 帧 的 栈 帧 
longjmp 
sig alrm 
的 栈 帧 


图 C-11 longjmp 前 后 的 栈 帧 


在 sig_alrm 中 通过 longjimp 返 回 Ssleep2， 有 效 地 避免 了 继续 执行 
sig_int。 从 这 一 点 ，sleep2 返 回 main (回忆 图 10-8) ° 

10.4 在 第 一 次 调用 alarm 和 setjmp 之 间 又 有 一 次 竞争 条 件 。 如 果 
进程 在 调用 alarm 和 setjmp 之 间 被 内 核 阻 塞 了 ， 闸 钟 时 间 超 过 后 就 调用 
信和 号 处 理 程序 ， 然 后 调用 longjmp ° 


但 是 由 于 没有 调用 过 setjmp， 所 以 没有 设置 env_alrm 绥 冲 区 。 如 果 
longjmp 的 跳 转 缓冲 区 没有 人 被 setjmp 和 初始 化 ， 则 说 明 longjmp 的 操作 是 未 
定义 的 。 

10.5 参见 Don Libes 的 论文 “mplementing Software Timers” (C users 
Journal,Vol.8,no.11,Nov，1990 ) 中 的 例子 。 可 以 访 fal http:// 
www.kohala.com/start/ libes.timers.txt 获 得 该 论文 的 电子 版 。 

10.7 如 果 仅 仅 调 用 _exit， 则 进程 终止 状态 不 能 表示 该 进程 是 由 于 
SIGABRT 信 和 号 而 终止 的 。 

10.8 如 采信 号 是 由 其 他 用 户 的 进程 发 出 的 ， 进 程 必须 设置 用 户 ID 
为 根 或 者 是 接收 进程 的 所 有 者 ， 和 否则 kil 不 能 执行 。 所 以 实际 用 户 ID 为 
言 号 的 接收 者 提供 了 更 多 的 信息 。 

10.10 对 于 本 书 作者 所 用 的 一 个 系统 ， 每 60~90 分 钟 增加 一 秒 ， 这 
个 误差 是 因为 每 次 调用 sleep 都 要 调度 一 次 将 来 的 时 间 事 件 ， 但 是 由 于 
CPU 调度 ， 有 时 并 没有 在 事件 发 生 时 立即 被 唤醒 。 

另外 一 个 原因 是 进程 开始 运行 和 再 次 调用 sleep 都 需要 一 定量 的 时 
间 。 

cron 守 护 进程 这 样 的 程序 每 分 钟 都 要 获取 当前 时 间 ， 它 首先 设置 一 
个 休 眼 周期 ， 然 后 在 下 一 分 钟 开始 时 唤醒 。 (将 当前 时 间 转 换 成 本 地 
时 间 并 查看 tm. sec 值 。) 每 一 分 钟 ， 设 置 下 一 个 休 眼 周期 ， 使 得 在 下 
一 分 钟 开 始 时 可 以 唤醒 。 大 多 数 调 用 是 sleep(60)， 人 偶尔 有 一 个 sleep(59) 
用 于 在 下 一 分 钟 同步 。 但 是 ， 若 在 进程 中 花费 了 许多 时 间 执 行 命令 或 
者 系统 的 负载 重 、 调 度 慢 ， 这 时 休眠 值 可 能 远 小 于 60。 

10.11 在 Linux 3.2.0、Mac OS X 10.6.8 和 Solaris 10 中 ， 从 来 没有 调 
用 过 SIGXFSZ 的 信号 处 理 程序 ， 一 旦 文件 的 大 小 达到 1 024 时 ，write 就 
返回 24。 

在 FreeBSD 8.0 中 ， 当 文件 大 小 已 达到 1 000 字 节 ， 在 下 一 次 准备 写 
100 字 节 时 调用 该 信号 处 理 程 序 ，write 返 回 -1， 并 且 将 ermo 设 置 为 


EFBIG (文件 太 大 ) 。 

在 所 有 4 种 平台 上 ， 如 果 在 当前 文件 偏 移 量 处 《文件 尾 端 ) 尝试 
再 一 次 write， 将 收 到 SIGXFSZ 信 号 ，write 将 失败 ， 返 回 -1， 并 将 errno 
设置 为 EFBIG ° 

10.12 结果 依赖 于 标准 IO 库 的 实现 : fwrite 函 数 如 何 处 理 一 个 被 中 
Ir write ° 

GOO, ÆLinux 3.2.0 E, + f HdfwriteER 235i — P KJ Ze t CR , 
fwrite DB [8] BR] = AV Re FI write ^ YE writez& ZU AAS, p] aS] TR] 
到 ， 但 我 们 直到 写 结束 才 看 到 信和 号。 看 上 去 就 好 像 在 write 系 统 调用 进 
行当 中 内 核 阻塞 了 信号。 
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11.1 图 C-12 给 出 了 一 个 没有 使 用 目 动 变 量 ， 而 采用 动态 内 存 分 配 
的 程序 。 


#include "apue.h" 
#include «pthread.h» 


struct foo { 
int à, Db p d; 


H 


void 
printfoo(const char *s, const struct foo *fp) 
{ 

fputs(s, stdout); 


printf(" structure at Ox$l1xWMn", (unsigned long) fp); 
printf(" foo.a = $dMn", fp->a); 
printf(" foo.b = %d\n", fp->b); 
printf(" foo.c = %d\n", fp-»5c); 
) 


printf(" foo.d = d\n", fp->d); 


void * 
thr fnl(void *arg) 
( 


struct foo *fp; 


if ((fp = malloc(sizeof(struct foo))) == NULL) 
err sys("can't allocate memory"); 

fp->a = 1 

fp->b = 2 

fp->c = 3 

fp->d = 4; 


printfoo("thread:\n", fp); 
return((void *) fp); 


} 


int 

main (void) 

{ 
int err; 
pthread_t tidl; 
struct foo *fp; 


err = pthread_create(&tidl, NULL, thr_fnl, NULL); 
if (err != 0) 

err exit(err, "can't create thread 1"); 
err = pthread_join(tidl, (void *)&fp); 
if (err != 0) 

err_exit(err, "can't join with thread 1"); 
printfoo("parent:\n", fp); 
exit(0); 


图 C-12 线程 返回 值 的 正确 使 用 

11.2 要 改变 挂 起 作业 的 线程 ID ， 必 须 持 有 写 模 式 下 的 读 写 锁 ， 防 
止 ID 在 改变 过 程 中 有 其 他 线程 在 搜索 该 列表 。 目 前 定义 该 接口 的 方式 
存在 的 问题 在 于 : 调用 job find 找到 该 作业 以 及 调用 job_remove 从 列表 
中 删除 该 作业 这 两 个 时 间 之 间作 业 ID 可 以 改动 。 这 个 问题 可 以 通过 在 
job 结构 中 花 入 引用 计数 和 互 斥 量 ， 然 后 让 job_find 增 加 引用 计数 的 方法 
来 解决 。 这 样 修改 ID 的 代码 就 可 以 避免 对 列表 中 非 零 引 用 计数 的 任何 
作业 进行 ID 改动 的 情况 。 

11.3 首先 ， 列 表 是 由 读 写 锁 保 护 的 ， 但 条 件 变量 需要 互 斥 量 对 条 
件 进 行 保 护 。 其 次 ， 每 个 线程 等 待 满足 的 条 件 应 该 是 有 某 个 作业 进行 
处 理 时 需要 的 条 件 ， 所 以 需要 创建 每 线程 数据 结构 来 表示 这 个 条 件 。 


或 者 ， 可 以 把 互 不 量 和 条 件 变 量 舱 入 到 queue 结 构 中 ， 但 这 意味 着 所 有 
的 工作 线程 将 等 待 相同 的 条 件 。 如 果 有 很 多 工作 线程 存在 ， 当 唤醒 了 
许多 线程 但 又 没有 工作 可 做 时 ， 台 可 能 出 现 惊 群 效应 问题 ， 最 后 导致 
CPU 资 源 的 浪费 ， 并 且 增 加 了 锁 的 争夺 。 

11.4 这 根据 具体 情况 而 定 。 辟 的 来 说 ， 两 种 情况 都 可 能 是 正确 
的 ， 但 每 一 种 方法 都 有 不 足 之 处 。 在 第 一 种 情况 下 ， 等 待 线程 会 被 安 
排 在 调用 pthread_cond_broadcast 之 后 运行 。 如 果 程 序 运 行 在 多 处 理 器 
上 ， 由 于 还 持 有 互 斥 锁 (pthread cond waibk[B| ER ARB) ， 一 些 
线程 就 会 运行 而 且 蕊 上 阻塞。 在 第 二 种 情况 下 ， 运 行 线程 可 以 在 第 3 
步 和 第 4 步 之 间 获 取 互 不 锁 ， 然 后 使 条 件 失 效 ， 最 后 释放 互 不 锁 。 接 
着 ， 当 调用 pthread_cond_broadcast 时 ， 条 件 不 再 为 真 ， 线 程 无 需 运 行 。 
这 束 是 为 什么 唤醒 线程 必须 重新 检查 条 件 ， 不 能 仅仅 因为 
pthread, cond wait? K ERREKEN E ° 

第 12 章 

12.1 束 像 人 们 上 自 先 会 猜 到 的 ， 这 并 不 是 一 个 多 线程 问题 。 这 些 标 
准 IO 例 程 事实 上 是 线程 安全 的 。 我 们 调用 fork 时 ， 每 个 进程 获得 了 标 
准 IO 数 据 结构 的 一 份 副本 。 程 序 运 行 时 把 标准 输出 定向 到 终端 时 ， 输 
出 是 行 缓 神 的 ， 所 以 每 次 打印 一 行 时 ， 标 准 MO 库 瓯 把 该 行 写 到 终端 
上 。 但 是 ， 如 采 把 标准 输出 重 定 同 到 文件 的 话 ， 则 标准 输出 就 是 全 组 
冲 的 。 当 缓冲 区 满 或 者 进程 天 闭 流 时 ， 输 出 才 会 写 到 文件 。 在 这 个 例 
子 中 ， 执 行 fork 时 ， 缓 冲 区 中 包含 了 还 未 写 的 几 个 打印 行 ， 所 以 当 父 进 
程 和 子 进 程 最 终 冲洗 缓 神 区 中 的 副本 时 ， 最 初 的 复制 内 容 束 会 写 入 文 
件 。 

12.3 理论 上 来 讲 ， 如 采 在 信和 号 处 理 程序 运行 时 阻塞 所 有 的 信和 号 ， 
那么 就 能 使 钞 数 成 为 异步 信号 安全 的 。 问 题 是 我 们 并 不 能 知道 调用 的 
某 个 函数 可 能 并 没有 屏蔽 已 经 补 阻 霍 的 信和 号， 这 样 通 过 男 一 个 信和 号 处 
理 程序 可 能 会 使 该 芳 数 变 成 可 重 入 的 。 


12.4 在 FreeBSD 8.0 E, FEF fü core « 用 gdb 的 话 ， 可 以 看 到 程序 
初始 化 过 程 将 调用 线程 函数 ， 这 些 函 数 调用 getenv 找 到 环境 变量 
LIBPTHREAD_SPINLOOPS 和 LIBPTHREAD_YIELDLOOPS 的 值 。 然 
而 ， 我 们 的 线程 安全 版 本 的 getenv 回 调 pthread 库 函数 会 处 于 一 种 中 间 的 
不 一 致 状态 。 另 外 ， 线 程 初始 化 函数 会 调用 malloc， 并 在 malloc 中 调 
用 getenv 来 查找 环境 变量 MALLOC_OPTIONS 的 值 。 

为 了 避 开 这 个 问题 ， 我 们 可 以 合理 假定 程序 启动 是 单线 程 的 ， 并 
使 用 一 个 标志 来 指示 线程 初始 化 已 经 通过 我 们 的 getenv 来 完成 了 。 但 这 
个 标志 为 假 时 ， 我 们 版 本 的 getenv 会 和 不 可 重 入 版 本 一 样 操作 (并 且 避 
免 调 用 任何 pthread 函 数 和 malloc) 。 然 后 我 们 提供 一 个 独立 的 初始 化 函 
数 来 调用 pthread_once， 而 非 从 getenv 里 面 来 调用 它 。 这 就 要 求 在 调用 
getenv 之 前 程序 调用 我 们 的 初始 化 画 数 。 这 就 解决 了 我 们 的 问题 ， 
为 只 有 程序 启动 初始 化 完成 后 才能 进行 。 当 程序 调用 了 我 们 的 初始 化 
函数 后 ， 这 个 版 本 的 getenv 就 是 线程 安全 的 。 

12.5 如 果 硕 望 在 一 个 程序 中 运行 另 一 个 程序 ， 还 需要 fork ( 即 在 调 
用 exec 之 前 ) 。 

12.6 图 C- is Ty f& Fi select 3l Z TR kE sleept, EIR — E 
数量 的 时 间 。 它 是 线程 安全 的 ， 因 为 它 并 不 使 用 任何 未 经 保护 的 全 局 
或 静态 数据 ， nee \ 调 用 其 他 线程 安全 的 函数 。 


#include <unistd.h> 
#include <time.h> 
#include <sys/select.h> 


unsigned 


sleep (unsigned seconds) 


{ 


int nm; 

unsigned slept; 
time t start, end; 
struct timeval tv; 


tv.tv sec - seconds; 
tv.tv usec = 0; 
time(&start); 


n  select(0, NULL, NULL, 
if (n == 0) 
return (0); 


time(&end); 

slept = end - start; 

if (slept >= seconds) 
return(0); 

return(seconds - slept); 


NULL, &tv); 


AIC-13 sleep 的 线程 安全 实现 


12.7 很 多 时 候 条 件 变量 的 实现 都 使 用 互 斤 锁 来 保护 它 的 内 部 结 


构 。 


Hike SEL ， 


ER WT ai S re CEE AY, Pr DA ee fork Mh EHS 


序 中 没有 可 移植 的 方法 获取 或 释放 锁 。 既 然 在 调用 fork 后 并 不 能 确定 条 
件 变 量 中 的 内 部 锁 状 态 ， 所 以 在 子 进 程 中 使 用 条 件 变量 是 不 安全 的 。 
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13.1 如 果 进 程 调用 chroot， 它 残 不 能 打开 /dewlog。 解 决 的 办 法 是 ， 
守护 进程 在 调用 chroot 之 前 调用 选项 为 LOG_NDELAY 的 openlog。 它 打 
开 特 殊 设 备 文件 (UNIX 域 数据 报 套 接 字 ) 并 生成 一 个 描述 符 ， 即 使 调 
用 了 chroot 之 后 ， 该 描述 符 仍 然 是 有 效 的 。 这 种 场景 在 诸如 ftpd (文件 
传输 协议 守护 进程 ) 这 样 的 守护 进程 中 出 现 ， 为 了 安全 起 见 ， 专 门 调 
用 了 chroot， 但 仍 需 要 调用 syslog 来 对 出 错 条 件 记 录 日 志 。 


13.4 图 C-14 展 示 了 一 


种 解决 方案 。 


#include "apue.h" 


int 

main (void) 

( 
FILE *fp; 
char *p; 


daemonize ("getlog"); 
P = getlogin(); 


fp = fopen("/tmp/getlog.out", "w"); 
if (fp != NULL) { 
if (p == NULL) 
fprintf (fp, "no login name Mn"); 
else 


fprintf(fp, "login name: %s\n", p); 
) 
exit (0); 


图 C-14 调用 daemonize 然 后 获得 登录 名 


其 结果 依赖 于 不 同 的 系统 实现 。daemonize 关 闭 所 有 打开 文件 描述 
符 ， 然 后 向 /devnull 再 打开 前 3 个 。 这 意味 着 进程 不 再 有 控制 终端 ， 所 
以 getlogin 不 能 在 utmp 文 件 中 看 到 进程 的 登录 项 。 于 是 在 Linux 3.2.0 和 
Solaris 10 中 ， 我 们 发 现 守 护 进 程 没 有 登录 名 。 

但 是 在 FreeBSD 8.0 和 Mac OS X 10.6.8 中 ， 登 录 名 是 由 进程 表 维 护 
的 ， 并 且 在 执行 fork 时 复制 。 也 就 是 说 ， 除 非 其 父 进 程 没有 登录 名 (如 
系统 自 引 导 时 调用 init) ， 否 则 进程 总 能 获得 其 登录 名 。 
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14.1 测试 程序 如 图 C-15 所 示 。 


#include "apue.h" 
#include «fcntl.h» 
#include «errno.h» 


void 

sigint(int signo) 
{ 

} 


int 

main (void) 

{ 
pid_t pidl, pid2, pid3; 
int Ld; 


setbuf (stdout, NULL); 
signal_intr (SIGINT, sigint); 


/* 

* Create a file. 

ur 

if ((fd = open("lockfile", O RDWR|O CREAT, 0666)) < 0) 
err sys("can't open/create lockfile"); 


/* 

* Read-lock the file. 

ki 

if ((pidl = fork()) < 0) { 
err_sys("fork failed"); 

} else if (pidl == 0) { P*.dhild *7/ 
if (lock reg(fd, F SETLK, F RDLCK, 0, SEEK SET, 0) « 0) 

err sys("child 1: can't read-lock file"); 

printf("child 1: obtained read lock on file\n"); 


pause(); 
printf("child 1: exit after pause\n"); 
exit(0); 
) else { /* parent */ 
sleep (2); 
} 
/* 
* Parent continues ... read-lock the file again. 
x 


if ((pid2 = fork()) < 0) { 
err sys("fork failed"); 
) else if (pid2 == 0) { [* child *7 
if (lock reg(fd, F SETLK, F RDLCK, 0, SEEK SET, 0) « 0) 
err sys("child 2: can't read-lock file"); 
printf("child 2: obtained read lock on file\n"); 
pause(); 


printf("child 2: exit after pause\n"); 


exit(0); 
) else { /* parent */ 
sleep(2); 
} 
/* 
* Parent continues ... block while trying to write-lock 
* the file. 
wf 


if ((pid3 = fork()) < 0) { 
err_sys("fork failed"); 
} else if (pid3 == 0) { /* child */ 
if (lock reg(fd, F_SETLK, F WRLCK, 0, SEEK SET, 0) « 0) 
printf("child 3: can't set write lock: %s\n", 
strerror(errno)); 
printf ("child 3 about to block in write-lock...\n"); 
if (lock_reg(fd, F_SETLKW, F_WRLCK, 0, SEEK_SET, 0) < 0) 
err_sys("child 3: can't write-lock file"); 
printf ("child 3 returned and got write lock????\n"); 


pause (); 
printf ("child 3: exit after pause\n"); 
exit(0); 
} else { /* parent */ 
sleep (2); 


/* 
* See if a pending write lock will block the next 
* read-lock attempt. 
e^ 
if (lock reg(fd, F SETLK, F RDLCK, 0, SEEK SET, 0) < 0) 
printf("parent: can't set read lock: %s\n", 
strerror (errno)); 
else 
printf("parent: obtained additional read lock while" 
"write lock is pending Nn"); 
printf("ktilliüg Child 1;..X8")4j 
kill(pidl, SIGINT); 
print’ ("killing child, 2... Xn"); 
kill(pid2, SIGINT); 
prints ("killing ehfld Fe sain): 
kill (pid3, SIGINT); 
exit (0); 


图 C-15 判断 记录 锁 的 行为 
在 FreeBSD 8.0 ` Linux 3.2.0 和 Mac OS X 10.6.8 上 ， 记 录 锁 的 行为 
是 相同 的 ， 后 增加 的 读者 可 使 未 决 的 写 者 不 断 等 待 。 运 行 该 程序 得 到 


child 1: obtained read lock on file 


child 2: obtained read lock on file 

child 3: can't set write lock: Resource temporarily unavailable 

child 3 about to block in write-lock... 

parent: obtained additional read lock while write lock is pending 

killing child 1... 

child 1: exit after pause 

killing child 2... 

child 2: exit after pause 

killing child 3... 

child 3: can't write-lock file: Interrupted system call 

14.2 大 多 数 系统 将 数据 类 型 fd_set 定 义 为 只 包含 一 个 成 员 的 结构 ， 
该 成 员 为 一 个 长 整 型 数组 。 

数组 中 每 一 位 (bit) 对 应 于 一 个 描述 行 。4 个 FD_ 宏 通过 开 、 关 或 
测试 指定 的 位 对 这 个 数组 进行 操作 。 

将 之 定义 为 一 个 包 舍 数组 的 结构 而 不 仅仅 是 一 个 数组 的 原因 十 : 
通过 C 语言 的 赋值 语句 ， 可 以 使 fd_set 类 型 的 变量 相互 赋值 。 

14.3 大 多 数 系 统 允 许 用 户 在 包括 头 文 件 <sys/selecth> 前 定义 常量 
FD_SETSIZE。 例 如 ， 我 们 可 以 写 下 面 这 样 的 代码 来 定义 fd_set 数 据 类 
型 ， 使 其 可 以 包含 2 048 个 描述 符 : 

#define FD SETSIZE 2048 

#include <sys/select.h> 

BRE, SEA EUERE 2g TEMAS AAA, R 
们 需要 做 以 下 几 件 事情 。 

(1) 在 包含 任何 头 文件 之 前 ， 我 们 需要 定义 哪 种 符号 来 防止 包含 
<sys/select.h>。 一 些 系统 会 使 用 一 个 单独 的 符号 来 保护 fd_set 类 型 的 定 
X, 我 们 也 需要 如 此 定义 。 


例如 ， 在 FreeBSD 8.0 中 ， 我 们 需要 定义 SYS SELECT H. 来 防止 
包含 <sys/selecth>， 定 义 _ FD_SET 来 防止 包含 fd_set 数 据 类 型 的 定义 。 
(2) 有 时 ， 为 了 和 旧 应 用 程序 兼容 ，<sys/types.h> 定 义 了 fd_set 的 
大 小 ， 所 以 我 们 必须 首先 包含 它 ， 然 后 去 掉 FD_SETSIZE 的 定义 。 注 
意 ， 一 些 系统 用 _FD_SETSIZE 来 代替 。 
(3) 想 能 够 使 用 select 时 ， 我 们 需要 重新 定义 FD SETSIZE (或 
. FD SETSIZE) 来 最 大 化 文件 描述 符 的 数量 。 
(4) 我 们 需要 取消 定义 第 一 步 定 义 的 符号 。 
(5) 最 终 ， 我 们 能 够 包含 <sys/select.h>。 
在 运行 程序 之 前 ， 我 们 需要 配置 系统 允许 我 们 打开 所 需 的 文件 描 
述 符 数量 ， 这 样 我 们 能 够 实际 利用 的 文件 描述 符 数 量 达 到 FD_SETSIZE 
个 o 


14.4 下 面 列 出 了 功能 类 似 的 函数 。 


FD ZERO sigemptyset 


FD SET sigaddset 
FD CLR sigdelset 


FD ISSET  Sigismember 


没有 与 sigfillset 对 应 的 FD_xxx 范 数 。 对 信号 量 集 来 说 ， 指 向 信号 量 
集 的 指针 总 是 第 一 个 参数 ， 信 号 编号 是 第 二 个 参数 。 对 于 描述 符 来 
说 ， 描 述 符 编号 是 第 一 个 参数 ， 指 疝 描 述 符 集 的 指针 是 第 二 个 参数 。 
14.5 利用 select 实 现 的 程序 见 图 C-16 ° 


#include "apue.h" 
#include <sys/select.h> 


void 
sleep_us(unsigned int nusecs) 


struct timeval tval; 


tval.tv_sec = nusecs / 1000000; 
tval.tv_usec = nusecs % 1000000; 
select(0, NULL, NULL, NULL, &tval); 


图 C-16 用 select 实 现 sleep_us 函 数 
利用 pol 实 现 的 程序 见 图 C-17 ° 


#include <poll.h> 


void 
sleep_us(unsigned int nusecs) 
{ 
struct pollfd dummy; 
int timeout; 


if ((timeout = nusecs / 1000) <= 0) 
timeout = 1; 
poll(&dummy, 0, timeout); 


图 C-17 用 poll 实 现 sleep_us 函 数 


如 BSD usleep(3) 手 册页 中 所 说 明 的 ， nanosleepER ZA, 1% 
函数 没有 与 调用 进程 设置 的 定时 器 交互 
14.6 不 行 。 我 们 可 以 使 TELL_WAIT 创 建 一 个 临时 文件 ， 其 中 1 个 
I eS IDE 
得 父 进 程 等 待 获 取 子 进程 字 方 上 的 锁 ， TELL_PARENT 使 得 子 进程 释 
i c due 但 是 问题 在 于 ， 调 用 fork 会 释放 所 有 子 进程 中 的 
锁 ， 使 得 子 进程 开始 运行 时 不 具有 任何 它 自己 的 锁 。 
14.7 图 C-18 中 示 出 了 一 种 解决 方法 。 


#include "apue.h" 
#include <fcntl.h> 


int 

main (void) 

{ 
IRE l1, Hy 
int fd[2]; 


if (pipe(fd) « 0) 
err sys("pipe error"); 
set fl(fd[1], O NONBLOCK) ; 


/* write 1 byte at a time until pipe is full */ 
for (n = 0; ; n++) { 
if ((i = write(fd[1], "a", 1)) != 1) ( 
printf("write ret $d, ", i); 
break; 


} 


printf ("pipe capacity = %d\n", n); 
exit (0); 


图 C-18 用 非 阻塞 写 计算 管道 的 容量 


下 表 列 出 了 在 本 书 所 壕 的 4 种 平台 上 计算 出 来 的 值 。 


FreeBSD 8.0 


Linux 3.2.0 
Mac OS X 10.6.8 
Solaris 10 


这 些 值 可 能 与 对 应 的 PIPE_BUF 值 不 同 ， 其 原因 是 ，PIPE_BUF 被 
定义 为 可 被 自动 原子 地 写 至 一 个 管道 的 最 大 数据 量 。 这 里 ， 我 们 计算 
的 是 一 个 管道 独立 于 任何 原子 性 限制 可 保持 的 数据 量 。 

14.10 图 14-27 中 的 程序 是 否 更 新 输入 文件 的 上 一 次 访问 时 间 依 赖 
于 操作 系统 以 及 文件 所 属 的 文件 系统 的 类 型 。 在 所 有 4 种 平台 中 ， 当 


文件 具有 给 定 操 作 系 统 默 认 的 文件 系统 类 型 ， 上 一 次 访问 时 间 束 会 更 
新 。 
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15.1 如 果 管 道 的 写 病 忌 古 不 关闭， 则 读者 就 决 不 会 看 到 文件 结 
从 。 分 页 程序 就 会 一 直 阻塞 在 读 标准 输入 。 

15.2 父 进程 向 管道 写 完 最 后 一 行 以 后 就 终止 ， 当 父 进程 终止 时 管 
道 的 读 端 自动 关闭 。 但 是 由 于 子 进 程 (分 页 程序 ) 要 等 待 输 出 的 页 ， 
所 以 父 进程 可 能 比 子 进程 领先 一 个 管道 缓冲 区 。 如 果 正 在 运行 的 是 一 
个 可 对 命令 行进 行 编辑 的 交互 式 shell， 如 Korn shell， 那 么 当 父 进程 终 
止 时 ，shell 多 半 会 改变 终端 的 模式 并 打印 一 个 提示 。 这 个 无 疑 会 影响 
已 经 对 终端 模式 进行 修改 的 分 页 程序 (由 于 大 部 分 分 页 程序 在 等 待 处 
理 下 一 个 页 面 时 将 终端 置 为 非 正 规模 式 ) 。 

15.3 因为 执行 了 shell， 所 以 popen 返 回 一 个 文件 指针 。 但 是 shell 不 
能 执行 不 存在 的 命令 ， 因 此 在 标准 错误 上 打印 下 面 信息 后 终止: 

sh: line 1: ./a.out: No such file or directory 

其 退出 状态 为 127 〈 该 值 取 决 于 shell 的 类 型 ) 。pclose 返 回 该 命令 
的 终止 状态 ， 这 如 同 从 waitpid 返 回 一 样 。 

15.4 当 父 进程 终止 时 ， 用 shell 看 它 的 终止 状态 。 对 于 Boume 
shell ` Bourne-again shell 和 Korn shell， 所 用 的 命令 是 echo $?， 打 印 的 结 
果 是 128 加 信和 号 编号。 

15.5 首先 加 入 下 面 的 声明 : 

FILE *fpin, *fpout; 

SR ia Hi fdopen AKE E TE UE EVO, HOR ENT a 
的 。 在 从 标准 输入 读 的 while 循 环 之 前 做 此 工作 。 

if ((fpin = fdopen(fd2[0], "7")) == NULL) 

err sys("fdopen error"); 
if ((fpout = fdopen(fd1[1], "w")) == NULL) 


err sys("fdopen error"); 
if (setvbuf(fpin, NULL, _IOLBF, 0) < 0) 
err sys("setvbuf error"); 

if (setvbuf(fpout, NULL,  IOLBF, 0) < 0) 

err sys("setvbuf error"); 

while 循 环 中 的 write 和 read 用 下 面 的 语句 代替 : 

if (fputs(line, fpout) == EOF) 
err sys("fputs error to pipe"); 

if (fgets(line, MAXLINE, fpin) == NULL) { 

err msg("child closed pipe"); 
break; 

j 

15.6 system 函数 调用 了 wait， 终 止 的 第 一 个 子 进 程 是 由 popen 产 生 
的 。 因 为 该 子 进程 不 是 system 创 建 的 ， 所 以 它 将 再 次 调用 wait 并 一 直 阻 
塞 到 sleep 完 成 。 然 后 system 返 回 。 当 pclose 调 用 wait 时 ， 由 于 没有 子 进 
程 可 等 竺 所 以 返回 出 错 ， 导 致 pclose 也 返回 出 错 。 

15.7 尽管 具体 细节 会 随 平台 不 同 而 不 同 〈 见 图 C-19) ， 但 是 select 
表明 描述 符 是 可 读 的 。 调 用 read 读 完 所 有 的 数据 后 ， 返 回 0 就 表明 到 
达 了 文件 尾 端 。 但 是 对 于 poll 来 说 ， 大 返回 POLLHUP 事件 ， 则 表明 也 
许 仍 有 数据 可 读 。 Le 是 一 旦 读 完了 所 有 的 数据 ，read 就 返回 0 表明 到 达 
了 文件 尾 端 。 在 读 完 了 所 有 的 数据 后 ，POLLIN 事 件 束 不 会 再 运 回 了 ， 
即使 需要 再 调用 一 次 read 以 接收 文件 尾 端 通知 (返回 值 为 0) 。 


| *P |] FreeBSD 8.0 Linux 3.2.0 | Mac OS X 10.6.8 | Solaris 10 


写 端 关闭 时 读 端 上 的 select 

WK n 时 读 端 上 的 poll 

端 关 闭 时 写 端 上 的 select 

出 关闭 时 写 端 上 的 poll W/ERR 
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图 C-19 select 和 poll 的 管道 行为 

图 C-19 中 所 示 的 条 件 包 括 R (可 读 ) ^w CATS) ^E (异常 ) 
HUP (ŻW) ^ ERR (错误 ) 和 INV (无 效 文件 描述 符 ) 。 对 于 引用 已 
被 读者 关闭 的 管道 的 输出 描述 符 来 说 ，select 表 明 该 描述 符 是 可 写 的 。 
但 当 我 们 调用 write 时 ， 产 生 SIGPIPE 信 和 号。 如果 和 忽略 该 信号 或 从 其 信号 
处 理 程序 中 返回 ，write 就 会 失败 ， 将 error 设 置 成 EPIPE。 而 对 于 poll， 
具体 的 行为 则 会 根据 平台 的 不 同 而 不 同 。 

15.8 子 进程 向 标准 错误 写 的 内 容 同 样 也 会 在 父 进 程 的 标准 错误 中 
出 现 。 只 要 在 cmdstring 中 包含 shell 重 定 同 2>&1， 就 可 以 将 标准 错误 发 
回 给 父 进程 。 

15.9 popen 范 数 fork 一 个 子 进程 ， 子 进程 执行 shell。 然 后 shell 再 调 
用 fork， 最 后 由 shell 的 子 进程 执行 命令 串 。 当 cmdstring 终 止 时 ，shell 恰 
好 在 等 竺 该 事件 。 然 后 shell 退 出 ， 而 这 一 事件 又 是 pclose 中 的 waitpid 所 
SERE 

15.10 解决 的 办 法 是 打开 (open) FIFO 两 次 : 一 次 读 ; 一 次 写 。 我 
们 决 不 会 使 用 为 写 而 打开 的 接 述 符 ， 但 是 使 该 描述 符 打 开 就 可 在 客户 
数 从 1 变 为 0 时 ， 阻 止 产 生 文件 尾 端 。 打 开 FIFO 两 次 需要 注意 下 列 操作 
方式 〈 如 非 阻塞 open 所 要 求 的 ) : 第 一 次 以 非 阻 塞 、 只 读 方式 open; 
第 二 次 以 阻塞 、 只 写 方式 open。 《如 果 移 用 非 阻 塞 、 只 写 方式 open， 
将 返回 错误 。) 然后 关闭 读 描述 符 的 非 阻塞 属 性 。 参 见 图 C-20 所 示 的 
代码 。 


#include "apue.h" 
#include «fcntl.h» 


#define FIFO "temp. fifo" 


int 
main (void) 
{ 
int fdread, fdwrite; 


unlink (FIFO); 

if (mkfifo(FIFO, FILE MODE) < 0) 
err sys("mkfifo error"); 

if ((fdread = open(FIFO, O RDONLY | O NONBLOCK)) « 0) 
err sys("open error for reading"); 

if ((fdwrite = open(FIFO, O WRONLY)) « 0) 
err sys("open error for writing"); 

clr fl(fdread, O NONBLOCK); 

exit (0); 


图 C-20 以 非 阻 塞 方式 打开 FIFO 进 行 读 、 写 操作 

15.11 随意 读 取 现行 队列 中 的 消息 会 干扰 客户 进程 -服务 器 进程 协 
议 ， 导 致 丢失 客户 进程 请 求 或 者 服务 慷 进 程 的 啊 应 。 只 要 知道 队列 的 
标识 符 或 者 该 队列 允许 所 有 的 用 户 读 ， 进 程 加 可 以 读 队 列 。 

15.13 由 于 服务 右 进 程 和 各 客户 进程 可 能 会 将 段 连 接 到 不 同 的 地 
址 ， 所 以 在 共享 存储 段 中 决 不 会 存储 实际 物理 地 址 。 相 反 ， 当 在 共享 
存储 段 中 建立 链表 时 ， 链 表 指 针 的 值 会 设置 为 共享 存储 段 内 另 一 对 象 
的 偏 移 量 。 偏 移 量 为 所 指 对 象 的 实际 地 址 减 去 共享 存储 段 的 起 始 地 
址 。 

15.14 图 C-21 显 示 了 相关 的 事件 。 


父 进程 的 i | 子 进程 的 1 | 共享 值 | update — 
设置 成 设置 成 | 设置 成 返回 


由 mmap 初始 化 
子 进 程 先 运行 ， 然 后 被 阻塞 
父 进程 运行 


然后 父 进程 被 阻塞 
子 进程 继续 


然后 子 进程 被 阻塞 
父 进 程 继续 


然后 父 进程 被 阻塞 


然后 子 进程 被 阻塞 
父 进程 继续 


图 C-21 图 15-33 中 父 进程 和 子 进程 之 间 的 交替 过 程 


第 16 章 
16.1 图 C-22 显 示 了 一 个 打印 系统 字 节 序 的 程序 。 


#include <stdio.h> 
#include <stdlib.h> 
#include <inttypes.h> 


int 
main (void) 
{ 
uint32_t i = 0x04030201; 
unsigned char *cp = (unsigned char *) &i; 


if (*cp == 1) 
printf ("little-endian\n") ; 


else if (*cp == 4) 

printf ("big-endian\n") ; 
else 

printf("who knows?\n"); 
exit (0); 


图 C-22 判断 系统 字 市 序 


16.3 对 于 我 们 将 要 监听 的 每 个 端点 ， 需 要 绑 定 到 一 个 合适 的 地 
址 ， 并 对 应 每 个 描述 符 在 fd_set 结 构 中 写 一 条 记录 。 然 后 使 用 select 等 待 
从 多 个 端点 来 的 连接 请 求 。 回 忆 16.4 节 ， 当 一 个 连接 请 求 达到 时 ， 一 个 
被 动 的 端点 将 会 变 得 可 读 。 当 一 个 连接 请 求 真 的 到 达 时 ， 我 们 接受 该 
请 求 ， 并 如 以 前 一 样 处 理 。 

16.5 在 main 过 程 中 ， 通 过 调用 我 们 的 signal 函 数 ( 见 图 10-18) 来 捕 
JÉSIGCHLD, ， 该 画 数 将 使 用 sigaction 来 安装 处 理 程 序 指定 可 重启 的 系 
统 调用 选项 。 下 一 步 ， 从 serve 芳 数 中 删除 waitpid 调 用 。 当 fork 完 子 进程 
来 处 理 请 求 后 ， 父 进程 天 闭 狐 的 文件 播 述 符 并 继续 监听 新 的 连接 请 
求 。 最 后 ， 需 要 一 个 针对 于 SIGCHLD 的 信号 处 理 程序 ， 如 下 : 


void 


sigchld(int signo) 
{ 
while (waitpid((pid_t)-1, NULL, WNOHANG) > 0) 

} 

16.6 为 了 允许 异步 套 接 字 MO， 需要 使 用 F_SETOWN fcnt 命 令 建 立 
套 接 字 所 有 权 ， 然 后 使 用 FIOASYNC ioctl 命令 允许 异步 信号 。 为 了 不 
允许 异步 套 接 字 WO， 只 要 简单 地 禁用 异步 信号 即 可 。 我 们 混合 使 用 
fcntl 和 ioctl 命令 的 理由 是 ， 想 找到 最 可 移植 的 方法 。 代 码 如 图 C-23 所 
= 


#include "apue.h" 

#include <errno.h> 

#include <fcntl.h> 

#include <sys/socket.h> 

#include <sys/ioctl.h> 

#if defined(BSD) || defined(MACOS) || defined(SOLARIS) 


#include <sys/filio.h> 
#endif 


int 


setasync(int sockfd) 


{ 


int ny 

if (fcntl(sockfd, F_SETOWN, getpid()) < 0) 
return(-1); 

n= 1; 


if (ioctl(sockfd, FIOASYNC, &n) < 0) 
return (-1); 
return (0); 


} 


int 
clrasync(int sockfd) 
{ 


int n; 


n = 0; 

if (ioctl(sockfd, FIOASYNC, &n) < 0) 
return (-1); 

return (0); 
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图 C-23 允许 与 不 允许 异步 套 接 字 IO 

17.1 常规 管道 提供 了 一 个 字 节 流 接 口 。 为 了 确定 消息 边界 ， 我 们 
必须 增加 给 每 个 消息 增加 一 个 头 部 来 指示 长 度 。 但 这 个 仍 涉及 两 个 额 
外 的 复制 操作 : 一 个 是 写 入 至 管道 ， 另 一 个 是 从 管道 读 出 。 更 加 有 效 
的 方法 是 仅 将 管道 用 于 告知 主线 程 有 一 个 新 消 已 可用。 我 们 用 单个 字 
节 用 作 通 知 。 采 用 这 种 方法 ， 我 们 需要 移动 mymesg 结 构 到 threadinfo 结 
构 ， 并 使 用 一 个 互 斥 量 (mute) 和 一 个 条 件 变量 (condition variable) 
来 防止 辅助 线程 在 主线 程 完成 之 前 重新 使 用 mymesg 结 构 。 解 决 方案 如 
图 C-24 所 示 。 


#include "apue.h" 
#include «poll.h» 
#include <pthread.h> 
#include <sys/msg.h> 
#include <sys/socket.h> 


#define NQ 3 /* number of queues */ 
#define MAXMSZ 512 /* maximum message size */ 
#define KEY 0x123 /* key for first message queue */ 


struct mymesg { 

long mtype; 

char mtext [MAXMSZ+1]; 
he 


struct threadinfo ( 


int 
int 
int 


qid; 
fd; 
len; 


pthread_mutex_t mutex; 
pthread_cond_t ready; 
struct mymesg m; 


}; 


void * 


helper (void *arg) 


{ 


int 


n; 


struct threadinfo *tip = arg; 


for(;;) { 


int 


memset (&tip->m, 0, sizeof(struct mymsg)); 
if ((n = msgrcv(tip-»qgid, &tip-»m, MAXMSZ, 0, 
MSG NOERROR)) « 0) 

err sys("msgrcv error"); 

tip->len = n; 

pthread mutex lock(&tip-»mutex); 

if (write(tip->fd, "a", sizeof(char)) < 0) 
err sys("write error"); 

pthread cond wait(&tip-»ready, &tip-»mutex); 

pthread mutex unlock(&tip-»mutex); 


C} 

i, jJ, BÉE; 
fd[2]; 
qid[NQ]; 


struct pollfd pfd[NQ]; 
struct threadinfo ti[NQ]; 
pthread t tid[NQ]; 


for 


GL = Qe x s NOS rrr) d 


if ((qid[i] = msgget((KEY*i), IPC CREAT|0666)) « 0) 


err sys("msgget error"); 


printf ("queue ID %d is %d\n", i, qid[i]); 


if (socketpair(AF UNIX, SOCK DGRAM, 0, fd) « 0) 
err sys("socketpair error"); 

pfd[i].fd = fd[0]; 

pfd[i].events = POLLIN; 

ti[i].gid = qid[i]; 

ti[i].fd.- far]? 

if (pthread cond init(&ti[i].ready, NULL) != 0) 
err sys("pthread cond init error"); 

if (pthread mutex init(&ti[i].mutex, NULL) !- 0) 


err sys("pthread mutex init error"); 
if ((err = pthread create(&tid[i], NULL, helper, 
&ti[i])) != 0) 
err exit(err, "pthread create error"); 


for (mr) 4 
if (poll(pfd, NQ, -1) « O) 
err sys("poll error"); 
for (i = 0; i < NQ; i++) { 
if (pfd[i].revents & POLLIN) { 
if ((n = read(pfd[i].fd, &c, sizeof(char))) < 0) 
err_sys("read error"); 
ti[i].m.mtext[ti[i].len] = 0; 
printf ("queue id %d, message %s\n", qid[il, 
ti[i].m.mtext); 
pthread mutex lock(&ti[i].mutex); 
pthread cond signal(S&ti[i].ready); 
pthread mutex unlock(&ti[i].mutex); 


exit (0); 


图 C-24 使 用 管道 的 XSI 消 息 轮 询 

17.3 声明 指定 了 标识 符 集 合 的 属性 (如 数据 类 型 ) 。 如 果 声 明 也 
导致 分 配 了 存储 单元 ， 那 么 这 束 是 定义 。 

在 头 文件 opend.h 中 ， 我 们 用 extern 存 储 类 声明 了 3 个 全 局 变量 ， 这 
时 并 没有 为 它们 分 配 存储 单元 。 在 文件 main.c 中 ， 我 们 定义 了 3 个 全 局 
变量 。 有 时 ， 我 们 也 会 在 定义 全 局 变量 时 束 初 始 化 它 ， 但 通常 是 使 用 C 
的 默认 值 。 

17.5 select 和 poll 返 回 歼 绪 的 摘 述 人 符 个 数 作 为 函数 值 。 当 将 这 些 残 绪 
描述 符 都 处 理 完 后 ， 操 作 client 数 组 的 循环 就 可 以 终止 。 

17.6 建议 的 解决 方案 存在 的 第 一 个 问题 是 ， 在 文件 可 能 发 生变 化 
的 地 方 ， 调 用 stat 和 调用 unlink 之 间 存 在 竞争 。 第 二 个 问题 是 ， 如 果 和 名 
字 是 一 个 指向 UNIX 域 套 接 字 文 件 的 符号 链接， 那么 stat 会 报告 名 字 是 
一 个 套 接 字 (回想 一 下 后 面 跟 一 个 符号 链接 的 stat 范 数 ) ， 但 是 调用 


unlink 时 ， 实 际 上 我 们 是 删除 了 这 个 符号 链接 而 不 是 套 接 字 文 件 。 为 了 
解决 第 二 个 问题 ， 应 该 使 用 lstat 而 不 是 stat， 但 这 解决 不 了 第 一 个 问 
题 。 

17.7 第 一 种 选择 是 将 两 个 文件 描述 符 在 一 个 控制 消 轧 中 的 发 送 ， 
每 一 个 文件 插 述 符 存 储 在 相 邻 的 内 存 位 置 中 。 下 面 的 代码 展示 了 这 种 
JH TR: 


struct msghdr msg; 


struct cmsghdr *cmptr; 

int *ip; 

if ((cmptr = calloc(1, CMSG  LEN(2*sizeof(int)))) == NULL) 

err sys("calloc error"); 

msg.msg control = cmptr; 

msg.msg  controllen = CMSG LEN(2*sizeof(int)); 

/* continue initializing msghdr... */ 

cmptr-^cmsg len = CMSG LEN(2*sizeof(int)); 

cmptr-^cmsg level = SOL SOCKET; 

cmptr-^cmsg type = SCM RIGHTS; 

ip = (int )CMSG DATA(cmptr); 

*ipt+ = fd1; 

*ip = fd2; 

这 种 方法 在 本 书 中 涉及 的 4 个 平台 上 全 都 可 以 工作 。 第 二 种 选 # 
将 两 个 独立 的 cmsghdr 结 构 打 包 到 一 个 消息 中 。 


struct msghdr msg; 


+x 
eu 


struct cmsghdr *cmptr; 
if ((cmptr = calloc(1, 2*CMSG_LEN(sizeof(int)))) == NULL) 
err sys("calloc error"); 


msg.msg control = cmptr; 


msg.msg. controllen = 2*CMSG LEN(sizeof(int)); 

/* continue initializing msghdr... */ 

cmptr->cmsg_len = CMSG_LEN(sizeof(int)); 

cmptr->cmsg_level = SOL_SOCKET; 

cmptr->cmsg_type = SCM_RIGHTS; 

*(int *)CMSG_DATA(cmptr) = fd1; 

cmptr = CMPTR_NXTHDR(&msg, cmptr); 

cmptr->cmsg_len = CMSG_LEN(sizeof(int)); 

cmptr->cmsg_level = SOL_SOCKET; 

cmptr->cmsg_type = SCM_RIGHTS; 

*(int *)CMSG_DATA(cmptr) = fd2; 

与 第 一 种 方法 不 同 ， 这 个 方法 只 在 FreeBSD 8.0 上 能 工作 。 

第 18 章 

18.1 注意 ， 由 于 终端 是 非 规范 模式 的 ， 所 以 必须 要 用 换行 符 而 不 
是 回 车 符 终止 reset 命 令 。18.2 它 为 128 个 字符 建 了 一 张 表 ， 根 据 用 户 的 
要 求 设置 最 高 位 (奇偶 校 验 位 ) 。 然 后 使 用 8 位 WO 处 理 奇偶 位 的 产生 。 

18.3 如 果 你 使 用 的 是 窗口 终端 ， 那 么 你 无 需 登 录 两 次 。 在 两 个 分 
开 的 窗口 之 间 ， 你 可 以 做 这 样 的 实验 。 在 Solaris 中 ， 运 行 stty -a， 并 且 
将 标准 输入 重 定 癌 到 运行 vi 的 终端 。 结 打 显 示 Vi 设 置 MIN 为 1、TIME 为 
1。read 调 用 会 一 直 等 每 ， 直 到 至 少 键 入 一 个 字符 ， 但 是 该 字符 输入 
后 ， 只 对 后 继 的 字符 等 待 十 分 之 一 秒 即 返回 。 

第 19 章 

19.1 telnetd 和 rlogind 两 个 服务 器 均 以 超级 用 户 权 限 运 行 ， 所 以 它 
们 都 可 以 成 功 地 调用 chown 和 chmod ° 

19.2 执行 pty -n stty -a 以 避免 伪 终 端 从 设备 的 termios 结 构 和 winsize 
结构 初始 化 。 

19.4 很 不 幸 ，fcnt 的 F_SETFL 命令 不 允许 改变 读 写 状态 。 


19.5 有 3 个 进程 组 : (1) 登录 shell， (2) pty 父 进程 和 子 进程 ， 
(3) cat 进 程 。 前 两 个 进程 组 组 成 了 一 个 会 话 ， 其 中 ， 登 录 shel] 为 会 话 
首 进 程 。 第 二 个 会 话 仅 包 仿 cat 进程。 第 一 个 进程 组 (登录 shell) 是 后 
台 进 程 组 ， 其 他 两 个 进程 组 是 前 台 进 程 组 。 

19.6 首先 ， 当 cat 从 其 行规 程 模块 接收 到 文件 结束 符 时 会 终止 。 这 
导致 PTY 从 设备 终止 ， 进 而 导致 PTY 主 设备 终止 。 接 着 ， 对 于 正 从 PTY 
主 设备 读 取 的 pty 父 进程 产生 一 个 文件 结束 符 。 该 父 进 程 将 SIGTERM 信 
号 发 送 给 子 进程 ， 于 是 子 进程 终止 。 ( 子 进程 不 捕捉 该 信号 。) 

最 后 ， 父 进程 调用 main 函数 尾 端的 exit(0) 。 

图 8-29 所 示 程 序 的 相关 输出 为 : 


cat e = 270, chars = 274,stat- 0: 

pty e = 262, chars = 40, stat = 15:F X 

pty e = 288, chars = 188, stat= 0: 

19.7 这 可 通过 使 用 shell 的 echo 命 令 和 date() 命 令 实现 ， 它 们 都 在 一 
个 子 shell 中 : 

#!/bin/sh 


(echo "Script started on " ‘date’; 
pty "${SHELL:-/bin/sh}"; 
echo "Script done on " ‘date ) | tee typescript 
19.8 PTY 从 设备 上 的 行规 程 能 够 回 显 ， 所 以 pty 从 其 标准 输入 所 读 
取 的 以 及 写 向 PTY 主 设备 的 按 默认 都 问 显 。 尽 管 程序 (ttyname) 从 不 
读 取 数据 ， 但 是 该 回 显 也 可 通过 从 设备 上 的 行规 程 模块 实现 。 
第 20 章 
20.1 _db_dodelete 中 保守 的 加 锁 操 作 是 为 了 避免 和 db_nextrec 发 生 竞 
争 条 件 。 如 有 果 没 有 使 用 写 锁 保护 _db_writedat 调用 ， 则 有 可 能 在 
db_nextrec 读 某 个 记录 时 ， 该 记录 已 被 删除 : db nextrec 首 移 读 入 一 个 


索引 记录 ， 判 定 该 记录 非 衬 ， 接 痢 读 数据 记 孙 ， 但 是 在 它 调用 
db_readidx 和 _db_readdat 之 间 ， 该 记录 却 可 能 被 _db_dodelete 删 除了 。 

20.2 假定 db_nextrec 调 用 _db_readidx， 它 将 记录 的 键 读 入 索引 缓冲 
区 。 然 后 ， 该 进程 被 内 核 调度 进 程 暂停 ， 另 一 个 进程 运行 ， 它 刚好 调 
用 db_delete 删 除了 这 一 条 记录 ， 使 得 索引 文件 和 数据 记录 文件 中 对 应 
部 分 都 被 清空 。 当 第 一 个 进程 恢复 执行 并 调用 _db_readdat (在 
db_nextrec 函 数 体 中 ) 时 ， 返 回 的 是 空 数据 记录 。db_nextrec 中 的 读 锁 使 
得 读 入 索引 记录 的 过 程 和 读 入 数据 记录 的 过 程 是 一 个 原子 操作 (对 于 
其 他 操作 同一 数据 库 的 合作 进程 而 言 ) 。 

20.3 强制 性 锁 对 其 他 的 读 进 程 和 写 进 程 产生 了 影响 。 在 
_db_writeidx 和 _db_writedat 设 置 的 锁 被 解除 之 前 ， 其 他 的 读 操 作 和 写 操 
作 都 将 被 阻 署 。 

20.5 在 写 索 引 记 录 之 前 写 数 据 记 录 ， 通 过 这 一 方法 来 防止 如 下 情 
JÉ: 若 该 进程 在 两 次 写 之 间 人 被 杀 死 从 而 产生 不 正常 的 记录 。 如 采 进 程 
先 写 索引 记录 ， 而 在 写 数 据 记 了 录 之 前 被 杀 死 ， 那 么 就 会 得 到 一 个 有 效 
的 索引 记录 ， 但 它 却 指 癌 一 个 无 效 的 数据 记录 。 

第 21 章 

21.5 这 里 有 一 些 提示 。 有 两 个 地 方 可 以 检查 队列 中 的 作业 打印 
守护 进程 的 队列 和 网 络 打 印 机 的 内 部 队列 。 注 意 ， 不 要 让 一 个 用 户 可 
以 取消 其 他 用 户 的 打印 作业 。 当 然 ， 超 级 用 户 可 以 取消 任何 作业 。 

21.7 不 需要 唤醒 守护 进程 ， 因 为 知道 需要 打印 一 个 文件 时 才 需 要 
重读 配置 文件 。printer thread 函数 在 每 次 回 打 印 机 发 送 作业 之 前 检查 是 
否 需 要 重读 配置 文件 。 

21.9 需要 使 用 null 字 节 来 终止 写 到 作业 文件 的 字符 串 (strlen 在 计算 
字符 串 长 度 时 不 包含 终止 nul 字 节 ) 。 有 两 种 简单 的 方法 : 要 么 对 写 入 
的 字 节 数 加 1， 要 么 使 用 dprintf 函 数 而 不 是 调用 sprintf 和 write ° 
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